mineo通信障害(2020/2/11)のお詫びならびに原因と対策について
mineoの責任者をしております、福留康和です。
先般、2020年2月11日19時34分頃に発生したmineo通信障害により、約6時間もの間、Aプランで最大29万件、D・Sプランで最大50万件のお客さまがデータ通信不可となってしまいました。
また、Aプランにつきましては、最大27万件のお客さまにおいて音声通話サービスもご利用不可となってしまいました。
長時間に亘り、多くのお客さまに大変なご不便、それからご迷惑をおかけいたしましたことを、あらためて、深くお詫び申し上げます。
昨日、今回の障害原因と再発防止策についてプレスリリースするとともに、mineoユーザーサポートサイトにも掲載させていただきました。
mineo 通信障害(2020/2/11)のお詫びならびに原因と対策について
https://optage.co.jp/press/2020/press52.html
本記事では、障害の原因や再発防止策について、ご説明させていただきます。
障害原因について
今回の障害は、①移動体通信事業者のネットワークに接続する当社装置※1(以下、PGW)において、偶発的な異常が2件同時に発生し、お客さまとの接続が一部切断されてしまったこと、
また、それにより②お客さま情報を管理するサーバ※2(以下、当該サーバ)への再接続要求が大量に発生し、処理が輻輳※3したこと、の2点が原因となっております。
復旧にあたっては、PGWから当該サーバへの情報のルートを切り離し、一時的に当該サーバを経由しないルートへ変更することで再接続要求の処理輻輳を回避いたしました。その結果、通信状態が安定し、2月12日1時30分頃に全プラン復旧となりました。
また、その後、当該サーバの負荷に問題がないことを確認しながら、順次通常運用状態へと回復させました。
(3月13日 20:40追記)
※1. お客さまがインターネット接続サービスをご利用するときは、au、ドコモ、ソフトバンクリアの各ネットワーク(以下、キャリアネットワーク)を経由し、mineoネットワークを通して、インターネットに接続されます。
その中でPGWは、mineoネットワークの入口にある、キャリアネットワークとの接続装置で、お客さまからのデータはすべてこの装置を経由します。装置の構成イメージはこちらをご覧ください。
※2. お客さま情報を管理するサーバは、PGWと連動して動く設備で、お客さまのプランをPGWに通知したり、ご利用されたパケットをカウントしたりする役割を担っています。
※3. 輻輳とは、当該サーバへのアクセスが集中し、処理待ちが連なって混雑している状態のことを示しています。
再発防止策について
当該サーバへの再接続処理に関する負荷の検証を実施し、当該サーバへの新規接続要求に対して適切な制限しきい値を設定することで、処理の輻輳を回避できるようにいたします。
(2020年9月14日追記)
上記対策は、2020年4月27日に完了いたしました。
周知面の改善について
今回の障害では、多数のお客さまから「障害の連絡が遅い」「サイトによって発信タイミングが異なっており状況がわからない」といったご指摘をいただきました。
そのため周知面での改善策として、同種の障害が万が一発生した場合でも、速やかに検知しmineoユーザーサポートに掲載するとともに、マイネ王, twitter, Facebookに自動連携できるようにいたします。
(2020年9月14日追記)
上記対策は、2020年6月5日に完了いたしました。
さいごに
長時間に亘りご利用不可であったこと、また、今回のような事象を二度と起こさないよう関係各所と議論・調整を行ってきた結果ではございますが、ご報告が遅くなってしまったことを、深く反省しております。
お客さまに安心してお使いいただけるよう、今後も日々改善に努めてまいります。引続きmineoをどうぞよろしくお願い申し上げます。
まさかmineoはあれほど大きな障害があったのに、何も報告しないのかと思ってしまいました。。。
自分はaプラン、dプランを併用していますが、両方ともアウトだったので、mineo側のトラブルだとある程度判断できましたが、1回線だけの契約だった場合、自身の端末の不具合なのかと心配になられたと思います。
今回、障害中の状況報告も、障害解析の報告も非常に遅くて、mineoファンとしてもストレスが溜まりました。
この件を糧に、サポート体制の拡充を望みます。
モバイルとして使い物にならないようなことがまた起こるとmineoを使用する意味がゼロになってしまいます
具体的な再発防止策をお願いします
偶発的異常についても当然mineo側は把握しているはずでしょうけど、そこまでユーザに開示すべきものではないと判断する事もあるでしょうから、そのことに対して「開示しろ」などと言うのもいかがなものかと思います。
こうやってユーザに対して発表する前に社内でコンセンサスを取る必要があるはずですから、それで時間がかかる事もあり得ます。
悲しいかな、所詮はMVNOなのですから、一社だけに頼るのではなく、フェイルセーフをユーザが確保しておく必要があるということなのではないかと思います。
自分の環境下では、十分快適に利用させて頂いてます。(4回線使用しています。)
障害ゼロにする事は、無理な事もわかっています。
報告として、偶発的2件の異常と書いた以上、その異常についての対策は必要だと思います。
安くしろとか、言いません。
報告できなければ、偶発的2件の異常は、書くべきではなかったと思います。
これからもマイネオでいたいので頑張って欲しいです^_^
まず第一報をいかに早く、そしてすぐの詳細報告が難しいのであればいつまでには報告するという目処を伝えておくことも大事かなと思います。
今回の反省を活かしてより良いサービスの提供をお願いします。1ユーザとして応援しています!
ご意見・ご要望、温かい応援など、たくさんの𠮟咤激励をいただき、
本当にありがとうございます。
〇まず、専門用語が多く、わかりづらい内容となっており、大変失礼
いたしました。
PGWやお客様情報管理サーバの説明を本文に追記するようにいたし
ます。
〇それから、2件の障害につきましては、いずれもPGW内の部品が
一時的なハードウェアエラーを起こしたことに起因します。また、設備
メーカーの分析の結果、これら異常の間に相関はないことが分かって
います。また、単一の異常に対しては通信を維持できる構成(冗長
構成)を確保していましたが、今回の障害のきっかけはほぼ同時に2つ
の異常が重なったことによるものであり、このような事象は非常に稀で
あると考えています。
そのため、システム全体の構成や実現性等を勘案し、万が一同様の事象
が起こった場合でも、接続不可が継続するという今回のような事態は
発生させないという観点で、今回の再発防止策を実施しています。
〇また、周知面の改善について、今回はお電話いただいた際に正確な情報
をお届けできず大変申し訳ありませんでした。
万一の際にお電話でもタイムリーに障害情報を把握いただけるよう、
障害発生に応じた音声案内ができるよう改善いたしました。
その他の周知手段につきましても、サポートサイト、マイネ王、SNS
だけでなく、幅広く周知できるよう改善検討を続けてまいります。
その他にも、たくさんの温かいお言葉、いただいておりますが、
一つひとつに真摯に向き合い、引続き、より良いサービスになるよう
継続的に改善を行い、最善を尽くしてまいります。
これからもどうぞよろしくお願いいたします。
重ね重ね丁寧な説明、ありがとうございます。
周知面の改善についてはやってもやっても悪さ加減は出てくると思いますが
改善を重ねていただければと思います。
>判りにくい説明と感じている皆さま
IIJさんのblogになりますが
https://eng-blog.iij.ad.jp/archives/88
を見ながら福留さんの説明を見返すとなんとなくわかるのでは、と思います。
機器故障は必ずありますので再び起こらないことを祈っております。
障害についてここまで詳しく説明があるのも珍しいなぁと好感持てましたが不具合の仕組みが複雑で理解はできてません
帰宅してWiFi飛んでる状況でかなり調べまくりました🙄
通信障害中ですよ〜ってって通知が即来るようになったら良いなあ😇
年1くらいで通信障害ある気がするけど、まあ普段困らないから今のまま安いmineoユーザー🤗
> 障害発生に応じた音声案内ができるよう改善いたしました。
これが一番大事。
部品故障はゼロにできないのだから
機器サポート保守の契約をしているなら
部品不具合はなくても予防的交換は
しないのかな?
相性っていうのもありますし。
色々勉強になったとプラスに考えてます。
対策ありがとうございます
wifi下にいることが多いので
障害に気がついたりすることは
ほとんどありません。
改善があって
利用者にとって良くなること
につながればいいし
安全な公共wifiが広がればいいなと
思います。
市や県のwifiがあるのですが
つながりませんからね
もう出来て数年経ちますが
このように改善したということも
聞かないですし
改善する姿勢や報告をすることはいいことだと感じています
既にスマホはライフラインなのでSNSに公式に発表を。
これからもmineoを使いたいと思っているので、頑張ってほしいです。
私のスマホが古いだけだったりして(^◇^;)
素人の私に詳しいことはわかりませんが、便利に使い続けられるのは、mineoの中の方々のおかげなので、これからも頑張ってください。
これからも安定運用よろしくお願いします。
期待していますので、よろしくお願いします❗
障害発生に応じた音声案内とありますが、キャンペーンについてもサポートダイヤルには間違った回答を連発されており、コールセンターに運営の情報がきちんと周知されていないように思います。
通信障害等の情報がユーザーに正確に伝わるよう体制の見直しをお願いします。
飛行機降りて機内モードから直した瞬間からだったので自分の携帯がダメになったと思ってリセットしまくり、パスワードなど色々消えました笑
困りましたが死ぬわけじゃないし。
マイネオさん、今後もよろしくお願いします!
お疲れ様っす
完全壊れたと思いました😂
でも、よかったです!!
今回の障害の分に1ヶ月。その期間に関しては適切だったと思います。
が、
いかんせん、
mineo 福留@運営事務局さま の
名前が出てくるのが遅過ぎます。
原因究明中で、解り次第報告させていただきます、みたいな感じで
2月中にmineo 福留@運営事務局さま
の言葉が出てくることを期待していました。
責任者として、
この1ヶ月、名前が出ないのは遅過ぎます。