![インターネット インターネット](https://srad.jp/static/topics/internet_64.png)
Cloudflare、ケーブルを誤って抜いてしまい4時間以上の障害発生 23
ストーリー by hylom
よくありそうなトラブルの大規模バージョン 部門より
よくありそうなトラブルの大規模バージョン 部門より
4月15日、コンテンツ配信サービスCloudflareのダッシュボードやAPIに約4時間21分にわたってアクセスできない状態が発生した。原因はデータセンター感を接続するファイバー接続の設定ミスだという(Publickey、Cloudflare)。
Cloudflareではこの時間帯にデータセンターの1つでメンテナンスを計画しており、技術者にとあるキャビネット内に収容されている未使用状態になっていた全機器を取り外すよう指示していたという。このキャビネットは外部への接続のためのパッチパネルへと接続されており、この作業時に誤ってパッチパネルのケーブルを抜いてしまったのが障害発生の発端になったそうだ。
これによってダッシュボードへのログインやAPIの使用、各種設定変更などの操作が行えなくなっていたとのこと。コンテンツ配信機能やセキュリティサービスなどへの影響はなかったという。Cloudflareは外部との全接続を1つのパッチパネルに集約していたことがトラブルの原因だったとし、接続を分離するとともに、トラブルを解決しやすくするためにケーブル接続に関するドキュメントを用意する、技術者にケーブルには触らないよう指示を出す、といった対策を行うとしている。
元記事さらっと読んだ感想 (スコア:3)
このキャビネットは外部への接続のためのパッチパネルへと接続されており、この作業時に誤ってパッチパネルのケーブルを抜いてしまったのが障害発生の発端になったそうだ。
ここ間違ってない?
「キャビネット内の未使用機器全部外しといて〜」
→キャビネット内には外部との接続用パッチパネルも入ってた
→「言われた通り全部外すかぁ〜」
→あぼーん
では?
掃除のおばちゃん出ないので責任問題 (スコア:1)
掃除のおばちゃんがその辺のコンセントに掃除機のコンセントを挿す。
↓掃除開始
UPSが悲鳴を上げる
レーザープリンターを繋いでいて、プリントの度に悲鳴は聞いたことがある。
Re:掃除のおばちゃん出ないので責任問題 (スコア:1)
掃除用のコンセントを勝手に使ってるアホが掃除のおばちゃんにより機器を外されて激怒
そもそもそこはお前らのコンセントじゃないとビル管理会社に言われ、上司から大目玉
みたいな話なら知ってる
Re:掃除のおばちゃん出ないので責任問題 (スコア:2)
回り回って、上司が悪いような。。。
管理ミスやろ?
Re: (スコア:0)
おばちゃんネタ禁止って言おうとしたけど遅かったか。
Re: (スコア:0)
掃除のおばちゃんはこのご時世、リスクを背負って掃除してくれているので大切にしたい。
トイレは感染源の溜まり場になり得るからな。
Re: (スコア:0)
「アメちゃん、食べる?」
Re: (スコア:0)
それは保険勧誘のおばちゃん
Re:掃除のおばちゃん出ないので責任問題 (スコア:1)
大阪なら、職種に関係なくどのおばちゃんもアメちゃんくれる。
俺も・・・「データセンター感」を養いたいと思う (スコア:1)
これは新しいアクティビティと見た。
これからの人類には必要だ。
Re:俺も・・・「データセンター感」を養いたいと思う (スコア:2)
Re: (スコア:0)
wolf03ってもしかしてコールサインですか?
Re:俺も・・・「データセンター感」を養いたいと思う (スコア:2)
Re: (スコア:0)
それってニュータイプの「ピキーン!」みたいな感じだと思う。
「ピキーン!」「この感じ!ケーブル断か!?」「ファイバー接続とはな!」「見える!私にもケーブルが見えるぞ!」的な。
Re: (スコア:0)
長いこと床を埋め尽くすスパゲッティとなってた配線をリケーブルした時に何度か見えたわ
無線を使える人たちはこれを繰り返して覚醒してたんだな
Re: (スコア:0)
実際作業中に誰か一人は覚醒してないと終わんないよ
五里霧中であんなん完成させるなんてどんだけ運のいい奴らが揃ってのかって話になる
Re: (スコア:0)
個人的には、ドカヘルかぶった猫が、ヨシ!とか言ってケーブル抜いている姿しか思い浮かばなかった。
Re: (スコア:0)
原文?は「データセンター感を接続する」とあるので
鉄血のオルフェンズの阿頼耶識システム的な何か
大手のトラブル (スコア:0)
Google、MSなどの大手で障害ある度
あんな大手でも障害はあるんだから、我々のサービスが(略
と声を出したい衝動が。
※言いませんよ。
Re:大手のトラブル (スコア:1)
"ある程度の障害はあって当たり前"で、GoogleとかMS等は"ダウンタイムを如何にして最小にするか"という運用な気がする。
"障害発生をゼロにする"だとどんだけコストかかるんだろう…
Re: (スコア:0)
実際には保証している品質を提供するのは無理なので、いかに免責事項を増やすかという運用の気もする。
Re: (スコア:0)
稼働率を保証しますが未達でも保障も補償もしません。
Re: (スコア:0)
魔法の言葉「ベストエフォート」を使わなきゃ。