パスワードを忘れた? アカウント作成
13786609 story
ネットワーク

ソフトバンクの通信網で大規模な通信障害、原因はEricssonの機器におけるソフトウェア障害 67

ストーリー by hylom
どうしてこうなった 部門より
maia曰く、

12月6日午後1時39分ごろから、ソフトバンクの通信網で大規模な通信障害が発生した。障害はY!MobileやLINE、mineo等のMVNOによるサービスにもおよび、約4千万人の契約者の大半に影響が出たとみられる。午後6時4分以降、順次復旧したようだ(産経新聞)。

原因はソフトバンクが採用しているEricsson製通信設備のソフトウェア不具合と発表されている(NHK)。ソフトバンクによると、Ericssonのソフトウェアは9か月前から運用しているという。英通信事業者O2など、Ericssonの通信設備を使用する海外11カ国の通信事業者においても、ほぼ同時刻に同様の障害が発生したようだ(ITmedia)。

復旧はソフトウエアを旧バージョンに戻す形で行なわれた(プレスリリース)。

ソフトバンクの大規模な障害は2018年になって3度目で、2月には市外局番03につながりにくくなる障害が発生、約67万人に影響。9月にはメール約1030万通が消失、約436万人に影響が出た。今回の障害は影響人数と時間の長さから、総務省は電気通信事業法上の「重大事故」と判断し、30日以内に事故の詳細と再発防止策の報告を求める方針。

また、Ericssonもこの問題を受けて「ソフトバンクの障害情報に関するお知らせ」とのプレスリリースを発表した(英語記事)。これらによると、問題が発生したのはSGSN–MME(Serving GPRS Support Node – Mobility Management Entity)というシステムで、「ソフトウェア証明書のバージョンの齟齬」が原因とされている。英語記事では「問題が発生した顧客のソフトウェアにインストールされていた証明書が失効していた」との記載もある。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by maia (16220) on 2018年12月07日 8時59分 (#3528582) 日記

    ケータイWatch [impress.co.jp]

    ソフトバンクは2016年2月にエリクソンのVirtual Mobility Management Entity(vMME)とOpenStackをベースにしたEricsson Cloud Execution Environment(ECEE)、オーケストレーション用Ericsson Cloud Manager(ECM)を導入

    ケータイWatch [impress.co.jp]

    (エリクソンによれば)早期の段階で判明している根本的な原因のひとつが、当該ソフトウェアの証明書の期限切れだったという。全容については調査中

    • by Anonymous Coward

      これはドコモの見解も聞いてみたい展開。

      • by Anonymous Coward on 2018年12月07日 17時41分 (#3529015)

        ドコモはマルチベンダ構成なので、エリクソン系統が落ちても他の系統でカバーしたのではないでしょうか。ドコモとしては、サービスが落ちたわけでもないし、サービス品質があからさまに低下したわけでもないので、特に見解は述べないでしょう。

        偶然かもしれませんが、手元のドコモスマホでは、普段は安定してフルにアンテナが立つ場所でも時々弱まったりしていました。エリクソン系統に接続されているシステムはトラブルに巻き込まれて一時的にダウンしたものの、他の系統に切り替えてサービスを維持していたのだろうと推測しています。

        それよりも、証明書の期限切れが問題だとしたら、ソフトバンクが「ソフトウエアを旧バージョンに戻すことで、復旧を行いました」と言っているのは、どういうことなのでしょうかね。虚偽報告か、はたまた旧バージョンはユルユルだったのか…。

        親コメント
        • by Anonymous Coward

          期限は十分あるけど、X-Dayから新証明書を使う設定になっていた現行バージョンを、
          旧証明書しか入っていないX-Day切り替えのない旧バージョンにロールバックしたとかでは。

      • by Anonymous Coward

        何故どこも?

      • by Anonymous Coward

        ドコモもauも肝を冷やしたのじゃないかなぁ。
        これは運用的にだれでも起きうる問題だし、慌てて確認してたりして。
        この間のうんこスイッチも証明書だっけ?

  • 世界最速復旧? (スコア:2, 参考になる)

    by Anonymous Coward on 2018年12月07日 18時05分 (#3529039)

    世界11カ国でほぼ同時に同一の障害が発生
    ソフトバンクは4時間20分で復旧
    英国のO2は25時間で復旧…
    障害発生した事自体はマイナスな印象だけど、世界的に見るとソフトバンクは優秀なのかなと好印象も持ってしまった。

    https://www.ft.com/content/95f860a2-f9d0-11e8-af46-2022a0b02a6c [ft.com]

    • by Anonymous Coward on 2018年12月07日 22時48分 (#3529250)

      世界11カ国でほぼ同時に同一の障害が発生
      ソフトバンクは4時間20分で復旧
      英国のO2は25時間で復旧…

      さすが光るものがあるな!

      親コメント
      • by Anonymous Coward

        禿だけに?(と言って欲しい?)

  • つながらなかったの? (スコア:2, おもしろおかしい)

    by Anonymous Coward on 2018年12月07日 19時30分 (#3529113)

    打線はつながるのに。

  • by kour (48336) on 2018年12月07日 16時32分 (#3528937)
    以前あったうんこぼたんと同じかな
  • 担当が変わるととたんにやらかすんだよね。

    • 自動更新の仕組みを作り込んでおく。

      親コメント
    • by Anonymous Coward

      人類に期限付き証明書は早すぎた。

      • by Anonymous Coward

        期限切れ証明書で認証拒否するってのは正常動作だから、ソフトウェアテストでは検出できんよね。
        MSのWindows10の件といい、これといい、最近ソフトウェアテスト万能論すぎて、
        やって当たり前のテストしてないことが多いように思う。

    • by Anonymous Coward

      一方日本は秘密の質問を仕掛けた

    • by Anonymous Coward

      有効期限が2038年のオレオレ証明書を使えばいいよ
      これで少なくとも2038年までは大丈夫

      2038年が近づくと、ほぼすべての実装で2038年問題は解決されるだろうから、
      その時は有効期限2099年のオレオレ証明書を使えばいい

      • by Anonymous Coward

        そうだ! 有効期限なしにすれば!

        • by Anonymous Coward

          先にCAの有効期限が切れるだろ。

          • by Anonymous Coward

            CAも商用CAつかわずに自前で立てたオレオレCAつかうとかでいいじゃん
            もしくはCAつかわずにセルフサインで済ますか

          • by Anonymous Coward

            そろそろ2038年問題以降の時刻対応のルート証明書は出ないのかな?
            もう19年ちょい先だから製品寿命迎える前にその日を迎える装置もそこそこあるだろうし、そろそろ将来重大な障害が起きる原因になりそう

    • by Anonymous Coward

      そもそも今回みたいな特殊な状況のソフトに証明書って必要なの?証明書期限切れでも無視するオプションって付けられないものなの?

      • by Anonymous Coward

        証明書なしで運用できてしまうと、通信の暗号化ができないので盗聴や改ざんの恐れが出てくる。
        証明書に期限があるのは一般的に動作させるソフトウェアの保守期限と合わせているから。
        保守期限を過ぎて運用されても安全に運用できるかわからないので、使えないようにする仕組みでもある。

  • by Anonymous Coward on 2018年12月07日 16時58分 (#3528973)

    ダウンディテクターの誤判定が多く出たみたいですね。

    ドコモとauは障害起きていなかったのに……「ダウンディテクター」が誤解広げた?
    http://www.itmedia.co.jp/news/articles/1812/07/news081.html [itmedia.co.jp]

    • by Anonymous Coward

      普通のウェブサービスとかだと、実際にアクセスして確認できるけど、
      携帯通信とかだと「ユーザーの声」に頼るしかないのかな。
      ゲートウェイが生きてても、キャリア内部のネットワーク内で不通ならダメだし。
      検知用の端末を契約して用意しておくとかしか・・・

  • このタイミングを狙ったかのような「帯域制限を超えた」、「退会届を受理した」だのソフトバンクを装ったようなスパムメールが多数来てた。(消したので具体的なタイトルはもう不明)
    ソフトバンクからのメールは通常のメールと違うのでよく確認すれば分かるが引っ掛かる人も居そうな感じ…

  • 原因のエリクソン機を廃して、中国・中興通訊(ZTE)や華為技術(HUAWEI)といった中国通信機器メーカーの製品を使えばいいんだよ。
    そして他社にも国にもそれを水平展開すべく、国のZTEやHUAWEI排除製作の撤回を求める。

  • by Anonymous Coward on 2018年12月07日 17時55分 (#3529033)

    障害発生中に「電波障害」がTwitterトレンド入りしていて、復旧リリースでは「LTE交換機の不具合」となっていてなんだろうと思っていたら、「圏外」表示を見て「電波障害」ってつぶやかれていたんですね。
    実際に、基地局からLTEの電波は止まっていたんでしょうか。

    ソフトバンクで通信障害 「急に圏外に」報告相次ぐ
    http://www.itmedia.co.jp/news/articles/1812/06/news094.html [itmedia.co.jp]

    • by Anonymous Coward

      LTEの基地局であるeNodeBは生きてるはずなので
      UE(端末)―eNodeB(基地局)でRRCは確立すると思われ

      ただ、そのあと端末からAttach Request(コアネットワークへの接続要求)が送信されても
      通常であればeNodeBを通過してMME(移動管理装置)―HSS(加入者情報管理装置)へと送られるところ
      MMEが死んでるんでSIMの認証はされないし、APNの要求すら飛んでこないので
      接続が確立しない、圏外表示になるってところですかね

      HSSが落ちたという話はないので、国内ローミングが可能であれば良かったかもしれませんね

  • by Anonymous Coward on 2018年12月07日 18時16分 (#3529051)

    ソフトバンク障害 影響広がる 飛行機 スマホ決済 宅配便も…
    https://www3.nhk.or.jp/news/html/20181206/k10011737231000.html [nhk.or.jp]

  • by Anonymous Coward on 2018年12月07日 18時57分 (#3529092)

    ずっと社内wi-fiなので問題なかった
    まあソフバンユーザじゃないけど…

    • by Anonymous Coward

      SB系だけど今どきPHS回線だったので全く影響ありませんでした(白目)

  • by Anonymous Coward on 2018年12月07日 23時21分 (#3529270)

    いつも複数の回線使えるようにしとけって教訓だ。冗長化の基本。

    docomo系とau系で別のMVNOと契約してDSDSなら手間もコストもかからない。

typodupeerror

私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike

読み込み中...