パスワードを忘れた? アカウント作成
7141981 story
バグ

KDDI、年末年始に発生した障害について詳細を公表 33

ストーリー by headless
対策 部門より
あるAnonymous Coward 曰く、

KDDIは16日、年末年始に発生した4G LTE端末でのデータ通信障害の原因と対策を説明した(ITmediaの記事日本経済新聞の記事ケータイWatchの記事)。

12月31日の通信障害は、LTEネットワークで使用する信号制御装置と信号中継装置で、セッションを解放するまでのタイマー値に不整合があったことが原因。タイマー値は信号制御装置で3秒、信号中継装置で2秒に設定されていたが、加入者プロファイルサーバーは通常0.1秒程度で応答するため、問題は発生していなかった。しかし、12月31日には加入者プロファイルサーバーがアクセス集中により無応答または認証遅延が発生し、信号制御装置で受け付けた信号が信号中継装置で破棄され、セッションが解放されてしまったとのこと。今後は信号制御装置のタイマーを1.2秒に変更するなどの対策を行う。

1月2日の障害は、信号制御装置で装置アラームの誤発報がきっかけ。装置アラーム発生時の手順書に不備があり、予備の装置に切り替えるべきところで装置全体の復旧措置を実施してしまったため、LTE端末とのセッションがすべて切断されてしまったとのこと。対策としては、手順書の整備や対応訓練などを実施済み。

このほか、1月1日にはau ID認証決済システムで障害が発生しているが、これは昨年11月にハード増強を実施した際にメモリー割り当て処理のパラメーターが誤っていたことが原因だという。メモリーの断片化が進んだ状態で負荷が高くなると障害が発生するというもので、認証処理の多い12月1日の段階では断片化が進んでいなかったため障害には至らなかった。その後断片化が進んだことから、1月1日に障害が発生したとのこと。対策として、パラメーター変更や監視項目の見直しなどを実施している。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • めんどくせぇ (スコア:1, おもしろおかしい)

    by Anonymous Coward on 2013年01月19日 13時58分 (#2308878)

    そりゃ機械は壊れることもあるさ。
    いちいち経緯書よこせとか言ってくる客はほんとにうぜぇ。
    お前いったいいくらコミッション払ってんだよ。嫌なら使うのやめろよ。

    • >いちいち経緯書よこせとか言ってくる客はほんとにうぜぇ。

      そうか延べ180万人近いユーザーに影響が出た障害だもの、理由と対策を公開するのは当然。

      それより ITmedia の記事にある

      12月31日の障害時は、通常時の7倍ものアクセスが集中したことで信号破棄機能が働き、信号中継装置への無応答や応答遅延が発生し、セッションが解放(切断)された

      12月31日午前0~3時までに「通常時の7倍ものアクセスが集中した」理由のほうが知りたいね。技術統括本部運用本部長は十分把握していないということだけど。

      --
      モデレータは基本役立たずなの気にしてないよ
      親コメント
      • by Anonymous Coward
        >12月31日午前0~3時までに「通常時の7倍ものアクセスが集中した」理由のほうが知りたいね。 以外に、本当に知らなかったりして。 基本的に、ユーザの通信内容は把握してないだろうし。 意味不明なトラフィック変動があって、ネットワークが輻輳して、自然復旧して。 あれは何だったんだ?? って事はよくあります。
        • by Anonymous Coward

          「L○NEはメールじゃないよねー」

          • by Anonymous Coward

            1/1 AM0:00- なら莫迦な学生共の
            >「L○NEはメールじゃないよねー」
            も成り立つだろうが、事象発生が 12/31 AM0:00- だから皆で首をひねってるわけで。

      • by Anonymous Coward

        通常より多い認証パケットが届いたことで応答が遅くなった。
        一定のしきい値を超えて古い認証が返ってきた場合は、それを破棄してまた問い合わせる。
        再送が増えたことにより、応答がさらに遅くなって、破棄されるパケットが急増。
        それが輻輳のきっかけとなって、次々とパケットが集中して7倍に膨れ上がった。
        ということなのでは?

    • by nmaeda (5111) on 2013年01月19日 17時20分 (#2308974)

      > 嫌なら使うのやめろよ。

      常識の範疇を超えた要求なら、それでもいい。

      だが、別に特に拘る少数のために説明責任があるわけじゃない。

      ひとりひとりは、「連絡できなくて(顧客/上司/彼女/義父……)に頭を下げるハメになったんだから、少しは説明があっても良いのにな」程度のことしか思っていなくても、影響を受けた顧客は何十万人(かな)といるのだから、その意識は人数分だけ乗算されると考えるのが普通のこと。だからマスコミ発表するわけだ。

      もちろん、同じトラブルを繰り返すと手間が掛かるばかりで面白くないし、客が減って自分の給料が減っては婚約したばかりの彼女に捨てられるかも知れないから、原因を究明して対策する。
      それだけのこと。

      親コメント
    • by o_tiket (38233) on 2013年01月20日 1時10分 (#2309181)
      正直、君のコメントには同意しかねる、が、 ネットワーク保守をしている身としては、その気持ち分からんでもない・・・・。 経緯書書くの、面倒だよね・・・・。 しかも、「うちも、障害が起きたときは経緯書貰うようにマニュアル化されてるので」 とか言われた日にゃぁ、やってられんですよ。
      親コメント
    • by Anonymous Coward

      それら全ての所作を含めて、企業や個人の信用が形成されているんでしょうね。

      個々の対応が大げさに見えても、何かあったらこの程度には調べるし結果を知らせてくれる、と分かれば、既存の、または将来の顧客にとっても頼もしく感じてもらえることはあるでしょう。

      一方、客の立場からすれば、そういう背景も全て含めて比較した上で、「嫌ならやめればいい」のだと思います。

    • by Anonymous Coward

      電話は社会インフラだから、大きなトラブルが起きると監督官庁の総務省が行政指導するので、「客がうぜぇ」ではすまされない。
      もうちっと、インフラを担っているという自覚を持ったらどうかね?

      • by Anonymous Coward on 2013年01月19日 14時46分 (#2308909)

        彼らはいわゆる第一種通信事業者ですからね。
        携帯業者に限らず、農協のCATV局だってdownすれば報告書を出さないといけませんので。。

        親コメント
        • by Anonymous Coward

          その点では、よほどのトラブルでもない限り行政指導喰らわないし、ロクに説明もできないソフトバンクよりずっとまともですね。

          • by Anonymous Coward

            SBって合併で大きくなった異種混合の会社ですから、鉄道通信を受け継ぐODNもあれば、暴れん坊YBBもいるわけで、、一概にSBではコメントできないかと。。

            • by Anonymous Coward

              旧ODNと旧YBBと現SBがそろって屑なだけですよね

              • by Anonymous Coward

                SBTM(ODN)ってそんなに悪い点ありましたっけ。確かに入札で競合したくない相手ではありますが…

        • by Anonymous Coward

          >彼らはいわゆる第一種通信事業者ですからね。

          違いますよ。そんな区分けは現存しません。

        • by Anonymous Coward

          それを言うなら携帯電話の場合、第二種指定電気通信事業者ですね。
          で、別コメのソフトバンク(モバイル?)は、指定を受けていない(色々理由をつけて逃げ回ってる)ので、よほどの事がない限り行政指導にはなりません

          • by Anonymous Coward
            2種指定は決まりました
    • by Anonymous Coward

      こんな尊大な業者は嫌だからやめますね

    • by Anonymous Coward

      まあこんな事を言う社員がいるなら
      経緯書をよこせとも言いたくはなりますね

  • by Anonymous Coward on 2013年01月19日 20時06分 (#2309055)

    はやくLTEが安定して普及して、3Gから少しでも移行してくれないかなあ。
    LTE対応機はしばらく買えないから、人任せ…。

    • by Anonymous Coward

      そのうち3Gの帯域が削られ、LTEに割り当てられるよ。

      • by Anonymous Coward

        それが不安。

        EMの3G帯域が全部LTE用でSBに持ってかれて
        下手すると今使ってる端末が使えなくなるんじゃないか
        なんてものすごく極端な心配をしてみたり。

        • by Anonymous Coward

          使えなくなるところまでいったら、LTE対応機(指定機種)に無償交換ということになるんじゃない?

          • by Anonymous Coward

            その頃までに料金が下がって、今の3Gと同じならいいのですが、今の料金での強制移行は値上げでしかないしね。
            それでiPhoneのバージョンアップ躊躇してます。

          • by Anonymous Coward

            DoCoMoで、MovaからFomaへの移行の時は、無償じゃなかった気がする。

          • by Anonymous Coward

            最近、auは基地局の変更に伴って使えなくなる端末が発生したけど、機種変更時の割引だけでしたよ。
            無償はないわ~。

    • 移行はどうしても年単位のゆっくりしたペースにならざるを得ないでしょう
      毎年買い換えるのなんて、ごく一部のヘビーユーザーくらいでしょうし

      • by Anonymous Coward

        強引に切り替えまくって、既存ユーザーに影響でまくってる柔らか銀行とかありますが。

        #知り合いも夏ぐらいから3Gが入らないエリアが増えたと聞いた。

        • by Anonymous Coward

          実名ではなく隠語で書くくらい自信がないんですね。

  • by Anonymous Coward on 2013年01月20日 12時36分 (#2309295)

    コレ系の値は、その値じゃないと動かないから固定値にしているのに、
    上の人のよくわからない取り決めで変更可能になり、
    事情のわからない後任者が適当に値を変更してしまうという・・・

    負荷系とかテストできないところはロジックから値を割り出すしかないのに、
    後でわからん人が変えたら本番障害に直結するってわかんないんですかね・・・

    • by Anonymous Coward

      設計根拠がドキュメントに書かれていれば、後任者が適切に設定変更できた可能性はありそうですが、実際どうなんでしょうね。ただ、設計根拠を書くには、システムを横通しで見るスキルが必要なので、末端のエンジニアには出来なかったりするんですよね。この辺りは、上位のエンジニアが設定根拠をチェックするプロセスが必要なのだと思います。

      そして、論理で確認できないところは、テストで問題の有無を検証するものだと思います。でも、本当にテストできなかったのだろうか?テストの因子や組み合わせ不足ではなかろうか?

typodupeerror

UNIXはシンプルである。必要なのはそのシンプルさを理解する素質だけである -- Dennis Ritchie

読み込み中...