mineo通信障害(2020/2/11)のお詫びならびに原因と対策について
mineoの責任者をしております、福留康和です。
先般、2020年2月11日19時34分頃に発生したmineo通信障害により、約6時間もの間、Aプランで最大29万件、D・Sプランで最大50万件のお客さまがデータ通信不可となってしまいました。
また、Aプランにつきましては、最大27万件のお客さまにおいて音声通話サービスもご利用不可となってしまいました。
長時間に亘り、多くのお客さまに大変なご不便、それからご迷惑をおかけいたしましたことを、あらためて、深くお詫び申し上げます。
昨日、今回の障害原因と再発防止策についてプレスリリースするとともに、mineoユーザーサポートサイトにも掲載させていただきました。
mineo 通信障害(2020/2/11)のお詫びならびに原因と対策について
https://optage.co.jp/press/2020/press52.html
本記事では、障害の原因や再発防止策について、ご説明させていただきます。
障害原因について
今回の障害は、①移動体通信事業者のネットワークに接続する当社装置※1(以下、PGW)において、偶発的な異常が2件同時に発生し、お客さまとの接続が一部切断されてしまったこと、
また、それにより②お客さま情報を管理するサーバ※2(以下、当該サーバ)への再接続要求が大量に発生し、処理が輻輳※3したこと、の2点が原因となっております。
復旧にあたっては、PGWから当該サーバへの情報のルートを切り離し、一時的に当該サーバを経由しないルートへ変更することで再接続要求の処理輻輳を回避いたしました。その結果、通信状態が安定し、2月12日1時30分頃に全プラン復旧となりました。
また、その後、当該サーバの負荷に問題がないことを確認しながら、順次通常運用状態へと回復させました。
(3月13日 20:40追記)
※1. お客さまがインターネット接続サービスをご利用するときは、au、ドコモ、ソフトバンクリアの各ネットワーク(以下、キャリアネットワーク)を経由し、mineoネットワークを通して、インターネットに接続されます。
その中でPGWは、mineoネットワークの入口にある、キャリアネットワークとの接続装置で、お客さまからのデータはすべてこの装置を経由します。装置の構成イメージはこちらをご覧ください。
※2. お客さま情報を管理するサーバは、PGWと連動して動く設備で、お客さまのプランをPGWに通知したり、ご利用されたパケットをカウントしたりする役割を担っています。
※3. 輻輳とは、当該サーバへのアクセスが集中し、処理待ちが連なって混雑している状態のことを示しています。
再発防止策について
当該サーバへの再接続処理に関する負荷の検証を実施し、当該サーバへの新規接続要求に対して適切な制限しきい値を設定することで、処理の輻輳を回避できるようにいたします。
(2020年9月14日追記)
上記対策は、2020年4月27日に完了いたしました。
周知面の改善について
今回の障害では、多数のお客さまから「障害の連絡が遅い」「サイトによって発信タイミングが異なっており状況がわからない」といったご指摘をいただきました。
そのため周知面での改善策として、同種の障害が万が一発生した場合でも、速やかに検知しmineoユーザーサポートに掲載するとともに、マイネ王, twitter, Facebookに自動連携できるようにいたします。
(2020年9月14日追記)
上記対策は、2020年6月5日に完了いたしました。
さいごに
長時間に亘りご利用不可であったこと、また、今回のような事象を二度と起こさないよう関係各所と議論・調整を行ってきた結果ではございますが、ご報告が遅くなってしまったことを、深く反省しております。
お客さまに安心してお使いいただけるよう、今後も日々改善に努めてまいります。引続きmineoをどうぞよろしくお願い申し上げます。
私のスマホ使用状態はほとんどがwifi環境下なので、障害発生に気がつきませんでした。又、仕事で使うこともないので実際の所は何の支障もありませんでした。
しかし、仕事で使っていたり、又、wifi環境を考慮できない使用法であったのであれば、他社への乗り換えを急ぎ検討していると思います。
1、mineoはすでに公共通信事業体の役割を担っているはずで、遊びの通信網では無いはずです。機械の故障や、ソフト異常、システム異常に対するバイパス切り替えやバックアップ体制が全くない(働かない)というのは信じられないです。
「PGWにおいて、偶発的な異常が2件同時に発生」と同様ことは、今後も必ず発生します。公共事業体である限り「偶発が同時に2件も、3件も発生」も免罪符にはならないと思います。
2、マイネ王掲示板では、「スマホが壊れたと思った」と云う声がたくさんありました。困り果て、「mineoサポートに電話照会したが『障害は発生していない』であった」というのも見掛けました。mineoの内部体制(緊急時の連絡網・手順など)も見直し・構築が必要かも
3、不特定多数の人に情報を発信する場合には、相手に自分の云わんとすることが伝わる必要があります。今回の「お詫びと対策」は、wzjmさんもおっしゃっていますが、言語が理解できない方も多かったのではないかと思います。
ある意味、家電製品の取説と同じです。専門家である設計担当が作った取説は必ず、素人(総務担当とか)に読んでもらって、その人が理解できるかどうか試してからの印刷でないと、取説を作った意味は半減します。
そんなことも、気にされた方がいいような・・・・。
戯言です
記載されている対策は原因➁に対するもの(当該サーバへの入力規制)のようですが、原因➀に対する再発防止の可否、要否はどうなのでしょうか。仮に、➀が再発しても、➁の輻輳が起きなければ、一切の障害は発生し得ないのでしょうか。
無制限Wi-Fiとのセット割とかもないですから、別の理由でもありますが。
再発防止をお願いします。
色んな方の書き込みを拝見しましてほかの方とかぶってしまう内容になるかと思いますが一言言わせて下さい。
今回の一件で貴社の対応がユーザーの皆様のためになっていますでしょうか。
それはユーザーが迷惑をこうむった事へのユーザー側へのメリットって意味です。
モバイル通信は生活の中でかなりのウエイトを占める大切なツールだと思っております。
利用者は費用を負担して例月24時間利用出来る権利を得てそれで貴社とユーザーとの契約が成り立っております。
私自身この時間に大事な予定をキャンセルとなってしまいました。
結果的に信用を失ってしまった事になります。
またその時に急いで帰宅して予備のスマホにsimを入れ替えるとの余分な移動も発生しました。
多くの通信会社がある中でmineoでないといけないと思う方ってどれだけいらっしゃるでしょうか?
一人一人のユーザーの皆様が大なり小なりの迷惑を被っております。
それでごめんなさい。ってそんな事が許されるのでしょうか。
NHKから国民を守る党の党首がテレビ局相手に訴訟を起こしている件よりもこれは賠償請求出来ると思いますね。
今一度よくご検討下さい。
はっきり言って対応が浅はかです。
親会社が関西電力なのでたかをくくっているのでしょうか。
1円スマホが貰えるBIGLOBEやY!mobileの方が色んな面で良いかと思います。
mineoさんを3年利用させていただき色々ありましたが信用は完全になくなりいよいよ潮時だと思っております。
mineoさんとしてはこれほどの大規模な障害は過去にも早々なかったと思いますので、広報担当の方やエンジニアの方との連携や情報共有なども難しかったのだろうと思います。
そもそもP-GWというネットワークのゲートウェイが不具合を起こしているのですから早急に障害を報告しようにも手段が限られてしまうわけですし、機器で制御している以上、障害を0には出来ませんから2度と障害を起こすなというのは土台無理な話です。あのNTTでさえ障害は発生してしまうのですから。ユーザー側にこそリスク分散を考えるべきかと思います。(中古のスマホで他社の安いプランで契約しておくとか)
じゃあ装置を冗長化しろよと言っても家電量販店で売ってるルーターとは桁が違うわけですから、下手すると基本料金を上げざるを得ないかもしれません。それをすべてのユーザーが許容できる事ではないのは想像に難くありません。
大手キャリアでしたらいくらでも設備投資は出来るでしょうがmineoさんのようなMVNO事業者は安い料金でユーザーに回線を提供しつつ、障害対策も考えなければいけないのですから、大変かと思います。
私個人の意見ですが、今後の障害対策としては、予め障害発生時のアラートを含めた社内フローの確立と各部門の責任者間で適宜進捗の確認、状況のアップデートを細かく社内及びユーザーに共有。
またmineoさんの通信設備の構成はわかりませんが、各ネットワーク機器の監視体制の強化と再発防止策にもありましたがしきい値の見直し。可能であればP-GWやDBの冗長化もしくはロードバランサーによるパケット制御とかでしょうか。まあこの辺は釈迦に説法かもしれませんね。
後はプレスリリースを含めもう少し専門的な内容にも突っ込むぐらいの詳細な障害報告も併せてお願いしたいです。
一般の方にもわかりやすく理解してもらうために簡略的にまとめられているのも必要かと思いますが、企業として公開する障害報告としては物足りなさは否めません。
なるべくなら正確な数字の表記(障害対象者数、障害発生時刻から障害復旧時刻等)や障害発生から復旧までに対応した内容や状況の詳細な時系列も加えて頂きたいと思います。
mineoさん、頑張ってね!
2/11はポケモンGOで伝説レイドバトルを始めてすぐネットワーク障害に遭ったため、ルーターで通信していた家族5台のレイドパスが無駄になってしまった。計¥600円くらいだからあきらめても良いが、通信パケットのギフトか何かで補償出来るならして欲しいところ。
また、いかに格安であっても、サービスを提供できない時間があった以上、すみませんでしただけではすまないのではないかと思います。報告までに1ヶ月かけたのであれば、その点にも言及して頂きたかったです。
コンビニへ駆け込んでフリーWi-Fiで接続出来たので、そこでようやくシステムダウンかよ、と解りました。
今後はこの様な事にならない様にお願いします。
所で、【お詫びだけで済むと思っているのか】とか【損害を受けたのだから弁償しろ】だの【物(金)寄こせ】とか。
そんなんでイチイチお詫び以上の事をする訳無いだろっての!
昔、某携帯電話キャリア本社でお客様相談室の仕事(要はクレーム引受部署)をしていましたが、毎月システムメンテナンス等で数分から数時間程度携帯電話が使用出来なくなるのですが(予めホームページなどで告知している)、その数分の間に電話が使えないから大口の商談を逃した。10億円弁償しろ!とか、こういう頭にウジの湧いたクレームは毎月来ましたね。そういう連中と一緒。
こういうバカクレーマー対策で要らんコストが毎月の料金に上乗せされていると考えるとなんともやるせないですね。まあ働いている方は給料が良くてウハウハでしたけど(バイトだけど時給2000円後半でした)。
【偶発的な問題が2件】の方がサラッと流す闇を感じる。
ココをしっかり説明すべき。
Dプランでも音声通信不可でしたよ。
私はWi-Fiがなかったので壊れたと思って翌日コンビニのWi-Fiを繋いでみてはじめて通信障害だと知りました
再発防止、よろしくお願いします!
障害についてはWiFi環境でしたので
気が付きませんでした。
それでも原因を追求し、
オープンで開示して頂けるのは有難い。
流石mineoですね。
某社は全く開示せず、
いつの間にか仕様変更されていたり
説明が曖昧で公開していたり
とてもユーザーが納得する説明が
ありませんでした。
私はmineoで良かったと思います。
これからも頑張ってください。
そしてよろしくお願いします。
mineo頑張れ!!
まえのSoftbankのは設備メーカーの問題だったみたいだし。
障害時、登録しているメールにも送ってくれるとありがたいんだけどなぁ(^o^;)
通信障害はない方がいいですが、今回他社と2台持ちすべきか考えさせられました。
こちらも色々勉強して、考えていかなくてはいけないと思います。
マイネオさん、今後に期待です。
頑張ってくださいね。
2/11は友人にメールを送ることになっていたので、ネットに繋がらないことに気付いた時は少し焦りました。あわてて自宅に帰り、PCから送信したので問題はないのですが。
皆さんのコメントから、2/11の通信障害がwifi環境にある方には起こらなかったことを知りました。
もちろん同じようなことが起こらないことを希望しますが、もしあったらwifi試してみます。
デスクの方は再発防止の策定お疲れ様でした。
通信障害の当日、人と連絡がとれずに困ったりもしましたが、大手を含めてどの会社でも通信障害は起こるものだと思ってます。
時間は経ちましたが、こうして情報開示する姿勢も好きです。
マイネオユーザー歴4年、月々の料金が安くいつも感謝して使ってます。
これからも定期的に点検をよろしくお願いします。
その時、別のスマホでネットで調べていたところ、障害発生を知り、自分のスマホ壊れてない事に逆に安心してしまいました(笑)
そんなに嫌ならやめたらええねん。
他のユーザーが減れば昼間の帯域も減ってwin-winだわ。
mineo自体は2回線契約してますがこんなこともあろうかとBiglobeも契約してた私に影響は無かったわけだがw
夜間対応で、障害アナウンスする人が決まっていないのかな?
自宅Wi-Fiに切り替え止まってるようだと、しばらくしてから戻してみても変わらない。
ああ、大手キャリアの電波は生きてるけどmineoのサーバーが何か問題あったなとまでは理解出来ました。
なかなか混乱の中大変かと想像に難く無いけども、もう少し状況報告してほしかった。
詫びパケットくれとは言わないけど。
昼間じゃなくて まだ 良かったとは思いますがやはり教訓とすれば
コストを考えると絶対におすすめはしないけどやはり複数の回線持ってた方が危機回避は出来るかと。
mineoの前はYmobileでしたが、これほど公然と正直に障害のフィードバックがアナウンスされた記憶はありません。
私はとても好感を持っています。
’18年の12月でしたっけ?キャリアのソフトバンクですら通信障害起こして総務省からお叱り受けたみたいですし、頻繁に通信障害起きなければ
稀にあるのは仕方ないんじゃないですかね?
問題はその後のフォローかと思われます。
障害発生当初、スマホが壊れた!と思いました。その後 家族からYahooにマイネオの通信障害の記事が載ってる、と聞いてほっとしましたが、御社からは何の連絡もありませんでした。
家族からの情報がなかったら、新しい端末を探して無駄な労力を掛けていたかもしれません。
原因究明も大事ですが速やかな連絡があって然るべきです。
あの時はびっくりしました。
どうして繋がらないのか別のパソコンで調べて納得したのですが、理由がすぐわかると本当はいいですね
回避策は、
ザックリ言うと閾値を設けて入力数(同時接続要求数)を落とす(=拒否される処理が発生する?!)、と。
これにより、
遅くなる処理は有ってもReplyを少しずつでも継続出来、全体としては長時間接続できないといった事が発生しなくなる…???
でも、、、
結局のところ、
ネットワークの通信量の制限(接続制限)と同じで、拒否されて、タイミングが悪く連続して拒否され続けた結果、接続できないのと変わらないとなるとなぁ…
といった風な事を素人は感じましたm(᎑ ᎑)m
QRコードによるキャッシュレス決済しか支払い方法がない場合、障害が発生したときに詰みますね。やはり、クレジットカードかICの電子マネーは持っておかないと、、、
詫び石はよ と思ったのはゲームに慣れきった感覚になっています。
皆さんの意見も踏まえてコメントさせてもらうと、気持ちだけの無料1メガの通信パケットでも配って頂けると、十分満足ではないでしょうか。
そもそも安い料金ですので、無くても良いかと個人的にはおもっています。
コールセンターの待ちが長いのは覚悟してました。障害は分かったが障害情報ダイヤルは障害ないとアナウンスされてると言うと、ホームページは案内していると案内され、障害情報ダイヤルは有りますが使われてませんっていう意味かな?
三大キャリアでも障害はつきものだと思います。回線借りているならなおさら。
障害情報ダイヤルがちゃんと機能していたらコールセンターに掛ける事も無かったし、この一言を聞くためだけに長時間待って、障害発生時の対応は早期復旧以外の対応をしてたのかなという気持ちを大きくしました。
障害が発生してる事がすぐにわかると助かります。
障害が出ない様によろしくお願いします。