KDDI、年末年始に発生した障害について詳細を公表 33
対策 部門より
KDDIは16日、年末年始に発生した4G LTE端末でのデータ通信障害の原因と対策を説明した(ITmediaの記事、 日本経済新聞の記事、 ケータイWatchの記事)。
12月31日の通信障害は、LTEネットワークで使用する信号制御装置と信号中継装置で、セッションを解放するまでのタイマー値に不整合があったことが原因。タイマー値は信号制御装置で3秒、信号中継装置で2秒に設定されていたが、加入者プロファイルサーバーは通常0.1秒程度で応答するため、問題は発生していなかった。しかし、12月31日には加入者プロファイルサーバーがアクセス集中により無応答または認証遅延が発生し、信号制御装置で受け付けた信号が信号中継装置で破棄され、セッションが解放されてしまったとのこと。今後は信号制御装置のタイマーを1.2秒に変更するなどの対策を行う。
1月2日の障害は、信号制御装置で装置アラームの誤発報がきっかけ。装置アラーム発生時の手順書に不備があり、予備の装置に切り替えるべきところで装置全体の復旧措置を実施してしまったため、LTE端末とのセッションがすべて切断されてしまったとのこと。対策としては、手順書の整備や対応訓練などを実施済み。
このほか、1月1日にはau ID認証決済システムで障害が発生しているが、これは昨年11月にハード増強を実施した際にメモリー割り当て処理のパラメーターが誤っていたことが原因だという。メモリーの断片化が進んだ状態で負荷が高くなると障害が発生するというもので、認証処理の多い12月1日の段階では断片化が進んでいなかったため障害には至らなかった。その後断片化が進んだことから、1月1日に障害が発生したとのこと。対策として、パラメーター変更や監視項目の見直しなどを実施している。
めんどくせぇ (スコア:1, おもしろおかしい)
そりゃ機械は壊れることもあるさ。
いちいち経緯書よこせとか言ってくる客はほんとにうぜぇ。
お前いったいいくらコミッション払ってんだよ。嫌なら使うのやめろよ。
「通常時の7倍ものアクセスが集中した」理由が知りたい (スコア:4, 興味深い)
>いちいち経緯書よこせとか言ってくる客はほんとにうぜぇ。
そうか延べ180万人近いユーザーに影響が出た障害だもの、理由と対策を公開するのは当然。
それより ITmedia の記事にある
12月31日午前0~3時までに「通常時の7倍ものアクセスが集中した」理由のほうが知りたいね。技術統括本部運用本部長は十分把握していないということだけど。
モデレータは基本役立たずなの気にしてないよ
Re: (スコア:0)
Re: (スコア:0)
「L○NEはメールじゃないよねー」
Re: (スコア:0)
1/1 AM0:00- なら莫迦な学生共の
>「L○NEはメールじゃないよねー」
も成り立つだろうが、事象発生が 12/31 AM0:00- だから皆で首をひねってるわけで。
Re: (スコア:0)
通常より多い認証パケットが届いたことで応答が遅くなった。
一定のしきい値を超えて古い認証が返ってきた場合は、それを破棄してまた問い合わせる。
再送が増えたことにより、応答がさらに遅くなって、破棄されるパケットが急増。
それが輻輳のきっかけとなって、次々とパケットが集中して7倍に膨れ上がった。
ということなのでは?
Re:めんどくせぇ (スコア:2)
> 嫌なら使うのやめろよ。
常識の範疇を超えた要求なら、それでもいい。
だが、別に特に拘る少数のために説明責任があるわけじゃない。
ひとりひとりは、「連絡できなくて(顧客/上司/彼女/義父……)に頭を下げるハメになったんだから、少しは説明があっても良いのにな」程度のことしか思っていなくても、影響を受けた顧客は何十万人(かな)といるのだから、その意識は人数分だけ乗算されると考えるのが普通のこと。だからマスコミ発表するわけだ。
もちろん、同じトラブルを繰り返すと手間が掛かるばかりで面白くないし、客が減って自分の給料が減っては婚約したばかりの彼女に捨てられるかも知れないから、原因を究明して対策する。
それだけのこと。
Re:めんどくせぇ (スコア:2)
Re: (スコア:0)
それら全ての所作を含めて、企業や個人の信用が形成されているんでしょうね。
個々の対応が大げさに見えても、何かあったらこの程度には調べるし結果を知らせてくれる、と分かれば、既存の、または将来の顧客にとっても頼もしく感じてもらえることはあるでしょう。
一方、客の立場からすれば、そういう背景も全て含めて比較した上で、「嫌ならやめればいい」のだと思います。
Re: (スコア:0)
電話は社会インフラだから、大きなトラブルが起きると監督官庁の総務省が行政指導するので、「客がうぜぇ」ではすまされない。
もうちっと、インフラを担っているという自覚を持ったらどうかね?
Re:めんどくせぇ (スコア:1)
彼らはいわゆる第一種通信事業者ですからね。
携帯業者に限らず、農協のCATV局だってdownすれば報告書を出さないといけませんので。。
Re: (スコア:0)
その点では、よほどのトラブルでもない限り行政指導喰らわないし、ロクに説明もできないソフトバンクよりずっとまともですね。
Re: (スコア:0)
SBって合併で大きくなった異種混合の会社ですから、鉄道通信を受け継ぐODNもあれば、暴れん坊YBBもいるわけで、、一概にSBではコメントできないかと。。
Re: (スコア:0)
旧ODNと旧YBBと現SBがそろって屑なだけですよね
Re: (スコア:0)
SBTM(ODN)ってそんなに悪い点ありましたっけ。確かに入札で競合したくない相手ではありますが…
Re: (スコア:0)
>彼らはいわゆる第一種通信事業者ですからね。
違いますよ。そんな区分けは現存しません。
Re: (スコア:0)
それを言うなら携帯電話の場合、第二種指定電気通信事業者ですね。
で、別コメのソフトバンク(モバイル?)は、指定を受けていない(色々理由をつけて逃げ回ってる)ので、よほどの事がない限り行政指導にはなりません
Re: (スコア:0)
Re: (スコア:0)
こんな尊大な業者は嫌だからやめますね
Re: (スコア:0)
まあこんな事を言う社員がいるなら
経緯書をよこせとも言いたくはなりますね
まあトラブルがないとは思ってないけれど (スコア:0)
はやくLTEが安定して普及して、3Gから少しでも移行してくれないかなあ。
LTE対応機はしばらく買えないから、人任せ…。
Re: (スコア:0)
そのうち3Gの帯域が削られ、LTEに割り当てられるよ。
Re: (スコア:0)
それが不安。
EMの3G帯域が全部LTE用でSBに持ってかれて
下手すると今使ってる端末が使えなくなるんじゃないか
なんてものすごく極端な心配をしてみたり。
Re: (スコア:0)
使えなくなるところまでいったら、LTE対応機(指定機種)に無償交換ということになるんじゃない?
Re: (スコア:0)
その頃までに料金が下がって、今の3Gと同じならいいのですが、今の料金での強制移行は値上げでしかないしね。
それでiPhoneのバージョンアップ躊躇してます。
Re: (スコア:0)
DoCoMoで、MovaからFomaへの移行の時は、無償じゃなかった気がする。
Re: (スコア:0)
最近、auは基地局の変更に伴って使えなくなる端末が発生したけど、機種変更時の割引だけでしたよ。
無償はないわ~。
Re:まあトラブルがないとは思ってないけれど (スコア:1)
自分はそれでdocomoに行ってしまいました。(MNPウマー)
まぁ、おおむね納得はしてます。
料金プランの2年縛りがあるので (スコア:0)
移行はどうしても年単位のゆっくりしたペースにならざるを得ないでしょう
毎年買い換えるのなんて、ごく一部のヘビーユーザーくらいでしょうし
Re: (スコア:0)
強引に切り替えまくって、既存ユーザーに影響でまくってる柔らか銀行とかありますが。
#知り合いも夏ぐらいから3Gが入らないエリアが増えたと聞いた。
Re: (スコア:0)
実名ではなく隠語で書くくらい自信がないんですね。
あるある・・・ (スコア:0)
コレ系の値は、その値じゃないと動かないから固定値にしているのに、
上の人のよくわからない取り決めで変更可能になり、
事情のわからない後任者が適当に値を変更してしまうという・・・
負荷系とかテストできないところはロジックから値を割り出すしかないのに、
後でわからん人が変えたら本番障害に直結するってわかんないんですかね・・・
Re: (スコア:0)
設計根拠がドキュメントに書かれていれば、後任者が適切に設定変更できた可能性はありそうですが、実際どうなんでしょうね。ただ、設計根拠を書くには、システムを横通しで見るスキルが必要なので、末端のエンジニアには出来なかったりするんですよね。この辺りは、上位のエンジニアが設定根拠をチェックするプロセスが必要なのだと思います。
そして、論理で確認できないところは、テストで問題の有無を検証するものだと思います。でも、本当にテストできなかったのだろうか?テストの因子や組み合わせ不足ではなかろうか?