パスワードを忘れた? アカウント作成
14205576 story
インターネット

NTTビズリンクのデータセンターで電源設備故障が発生、その影響で13自治体のWebサイトの名前解決ができなくなるなどのトラブル 43

ストーリー by hylom
最近よく聞くデータセンターの電源トラブル 部門より

自治体などに向けたクラウドサービスを手がけるスマートバリューの「SMART CMS」および「いくくるウェブ」で6月4日夜から障害が発生し、同サービスを利用している自治体のWebサイトが閲覧できない状態になっていたとのこと。すでに障害は復旧しているという(同社の発表日経xTECH)。

同サービスで利用していたDNSサーバーが、データセンターの電源設備故障で停止したのが原因とのこと。同社はDNSサーバーの運用を外部に委託しており、その委託先が使っていたNTTビズリンクのデータセンターで不具合が発生していたという(NTTビズリンクの発表)。これによると、データセンターのUPS設備内で短絡が発生してデータセンター内への電源供給が停止していたという。さらに分電盤内の突入電流防止装置が経年劣化しており、復電作業時に白煙が出るトラブルも発生したとのこと。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2020年06月08日 22時10分 (#3829708)

    まぁ見事に障害に巻き込まれました。
    しかし障害発生に気付いたのは、5日朝にクライアントからの「繋がらない」の連絡で。
    問い合わせ窓口のページはダウンに巻き込まれてアクセスできず、
    サポート電話は繋がらず、
    ようやく繋がった電話アナウンスで予備のサポートアドレスを知りアクセスするも情報は遅々として発信されず。
    問い合わせフォームから「状況連絡欲しい」旨を伝えるも返信は4時間後。
    その後も、1〜3時間毎にホームページに進捗状況をちょこっと載せるだけで、連絡一切無し。
    その後、復旧の連絡はおろか、謝罪の連絡など全くありません。
    データセンターの対応ってこんなもんなんですかね。

    • いわゆサービスレベルとかサポート体制とかであらかじめ合意してるんじゃないの?
      それ以下なら怒るところだろうけど、それなりならそんなもんという話なんでは?

      親コメント
    • by Anonymous Coward

      そんなもんですよ。
      幾ら払ってるか考えたらわかるでしょ。

    • by Anonymous Coward

      翌朝に気づく程度の運用の御社に言われてもね

    • by Anonymous Coward

      その程度のメール番でお給金いただける身に感謝だね☆

  • by Anonymous Coward on 2020年06月08日 15時09分 (#3829433)

    NTTコミュニケーションズで「水平移動」型の不正アクセス、621社の情報流出の恐れ
    https://security.srad.jp/story/20/05/29/1620256/ [security.srad.jp]

    • by Anonymous Coward

      この事例によってほかの設備の点検も入れば行幸なんだが…

  • by Anonymous Coward on 2020年06月08日 15時50分 (#3829462)

    UPSにしても突入電流防止装置にしても、電源関係を定期的に老朽化の予防交換していないのって怠慢じゃないか?
    でも、定期交換するUPSのバッテリーって費用が馬鹿にならないんだよなあ。制御装置の方も定期的に交換が必要だしな。

    • by Anonymous Coward on 2020年06月08日 17時22分 (#3829523)

      > 6.今後の対応について
      > ・分電盤内部品については、耐用年数内であるものの、経年劣化による故障発生の恐れがあるため、7月以降改修を実施
      耐用年数とは。

      親コメント
    • by Anonymous Coward

      建屋自体が古くてメンテナンス性悪いとかありそう

    • by Anonymous Coward

      UPSは予防交換以前にそもそも1系統故障してなんで停電するのって話じゃない?

    • by Anonymous Coward

      自前で施設も設備もハードウェアも持たずに月額課金するほうが安い事のほうがおかしいと思いますけどね。
      安かろう悪かろう。

      • by Anonymous Coward

        普通に、各個に小規模な設備&人員を持つより、それらを集約した大規模な設備等に委託したほうが安いのは
        よくある話だと思うが?

      • by Anonymous Coward

        Google Colaboratory Proの契約しちゃった。thpr

  • by Anonymous Coward on 2020年06月08日 15時53分 (#3829464)

    自治体では無いが、うち系列でも葛西のデーターセンターで電源設備の障害が起きてネットが止まった。
    件の時系列より遅くに発生し復旧は遅かった

    • by Anonymous Coward

      初動翌日昼過ぎってなめてるの?

  • by Anonymous Coward on 2020年06月08日 16時10分 (#3829479)

    クラウドサービスを提供するならDCが1つ死んだ程度で落ちる構成にしないでほしい

    • by Anonymous Coward on 2020年06月08日 17時15分 (#3829519)

      きっとDon't Careなのでしょう。

      DCだけに。

      親コメント
    • by Anonymous Coward on 2020年06月08日 17時43分 (#3829539)

      ACならいくらでも予備がいるのにな

      親コメント
      • by Anonymous Coward

        スラド棚のウラはACの卵でいっぱいだー!

        • by Anonymous Coward

          誰AC卵留年

        • by Anonymous Coward

          ソースのコメントにびっしり卵がありそうでやだな。
          変換して気付いたけど、🥚とか🍳とか余裕で出してきやがりますね。
          玉子の絵文字にタピオカが無いかと探したけど見つからなかったAC

  • by Anonymous Coward on 2020年06月08日 17時02分 (#3829510)

    DNSなんてプライマリだけで運用してるようなところはほぼ無いと思うんだけど。
    なんか隠してる雰囲気がプンプンするぜ。

    • by Anonymous Coward on 2020年06月08日 17時17分 (#3829520)

      やだなあ。セカンダリなんて隣のラックに置いてあるに決まってるじゃないですかハハハ。

      ※実際問題キチンとセカンダリNSを分散させてあるところって少ないと思う。IPアドレスが隣だったりするし。
      ※勿論IPアドレスが隣でも分散させる方法はあるがわざわざそんなことするか?

      親コメント
      • by Anonymous Coward

        意外と政令市くらいまではきっちりやってそうだよ。
        tracert しただけだけど。

        しかし、東京はカネモッテルナァ

      • by Anonymous Coward

        物理的には複数の場所にミラーが置いてあって、インターネットに対してはanycastしているなら、
        見えているIPアドレスが隣同士でも問題ない。
        でも、出来れば権威DNSサーバは複数のものを別ASに分散させておいた方がいいよね。

        • by Anonymous Coward

          だから、
          > ※勿論IPアドレスが隣でも分散させる方法はあるがわざわざそんなことするか?
          となるわけで。
          わざわざanycastするようならせめてDCだけでも分けて、おっしゃるように素直に別ASで、つまり連番じゃないIPアドレスでサーブするでしょ?って話で。

        • by Anonymous Coward

          ウチなんか、同じ筐体に入って(仮想化してるから)いるから、コンテンツサーバ(プライマリ、セカンダリ)、キャッシュサーバの全部が、一つのハードウェアが死亡すると全落ちするッス。

          一部、特にキャッシュサーバを、(地理的に 30㎞ くら離れた)あそこの事業所にしましょうよと進言(理由もリスクも問題が顕在化したときの状況も説明済)しましたが、予算がおりませんでしたので、傍観してます。「だから、言っていたのに・・・」という事態になる前に逃げ切れればいいな。

      • by Anonymous Coward

        同じラックじゃないだけまし・・・

      • by Anonymous Coward

        わざわざっていか、public cloudなら普通はanycastじゃね?(てきとー

  • by Anonymous Coward on 2020年06月08日 22時54分 (#3829730)

    なんでこう毎度毎度お粗末な原因ばかりなんだろうな。
    しかもお約束のように出てくる「委託先」って奴。

    もちろん米国系クラウドも障害は起こすが、ソフトウェアの不具合とか大規模DDoS攻撃とか・・・
    言ったら「技術者らしい不具合」って感じなんだけど。

    • by Anonymous Coward

      日本の場合、特に運用関係なんて「未経験者歓迎」で集めたド素人の中から簡単PGやテスターすらアウトだった人間送るトコになってるから。

      そいつ等に保守作業割当できるように、なんてするから余計な手間が多く複雑怪奇なシステムになって開発し辛い→炎上の一因。

      立て直しの時、そもそも余計な作業不要な設計にしたら凄まじかったからね抵抗が。
      まあユーザー企業リーダーがマトモだったので押し切れたけど。

      • by Anonymous Coward

        え、AWSの北米の初期リージョンは停電とかしょっちゅうじゃん
        結局会社じゃなくて場所によりけりじゃないの?

        • by Anonymous Coward

          AWSはデータセンター全断も設計時点で考慮されている仕様なので。
          リージョン全落ちしない限りは想定内の挙動だし、ユーザもそれを踏まえて構築する。

          本当に障害と言えるのは去年の東京リージョンの障害とかだけど、制御システムの不具合。

typodupeerror

「毎々お世話になっております。仕様書を頂きたく。」「拝承」 -- ある会社の日常

読み込み中...