スタッフブログ

mineo通信障害(2020/2/11)のお詫びならびに原因と対策について

サムネイル.png

〜 本文は省略されました 〜

しゅまりさんのコメント
ITインフラでお賃金を頂いている者としては、皆さんのコメントは納得すると同時に中々耳の痛い感じでもあったりします。
mineoさんとしてはこれほどの大規模な障害は過去にも早々なかったと思いますので、広報担当の方やエンジニアの方との連携や情報共有なども難しかったのだろうと思います。
そもそもP-GWというネットワークのゲートウェイが不具合を起こしているのですから早急に障害を報告しようにも手段が限られてしまうわけですし、機器で制御している以上、障害を0には出来ませんから2度と障害を起こすなというのは土台無理な話です。あのNTTでさえ障害は発生してしまうのですから。ユーザー側にこそリスク分散を考えるべきかと思います。(中古のスマホで他社の安いプランで契約しておくとか)
じゃあ装置を冗長化しろよと言っても家電量販店で売ってるルーターとは桁が違うわけですから、下手すると基本料金を上げざるを得ないかもしれません。それをすべてのユーザーが許容できる事ではないのは想像に難くありません。
大手キャリアでしたらいくらでも設備投資は出来るでしょうがmineoさんのようなMVNO事業者は安い料金でユーザーに回線を提供しつつ、障害対策も考えなければいけないのですから、大変かと思います。
私個人の意見ですが、今後の障害対策としては、予め障害発生時のアラートを含めた社内フローの確立と各部門の責任者間で適宜進捗の確認、状況のアップデートを細かく社内及びユーザーに共有。
またmineoさんの通信設備の構成はわかりませんが、各ネットワーク機器の監視体制の強化と再発防止策にもありましたがしきい値の見直し。可能であればP-GWやDBの冗長化もしくはロードバランサーによるパケット制御とかでしょうか。まあこの辺は釈迦に説法かもしれませんね。
後はプレスリリースを含めもう少し専門的な内容にも突っ込むぐらいの詳細な障害報告も併せてお願いしたいです。
一般の方にもわかりやすく理解してもらうために簡略的にまとめられているのも必要かと思いますが、企業として公開する障害報告としては物足りなさは否めません。
なるべくなら正確な数字の表記(障害対象者数、障害発生時刻から障害復旧時刻等)や障害発生から復旧までに対応した内容や状況の詳細な時系列も加えて頂きたいと思います。
mineoさん、頑張ってね!