アカウント名:
パスワード:
素人考えだと、スイッチを交換すればすぐ回復できそうなように思えます。
たぶん、ハブほど簡単に交換できるものじゃないのだろうとは思いますがこういった充分な資金力のある、大規模で信頼性が求められるシステムで
長時間、停止してしまうことを防ぐことはそれほど難しいことなのでしょうか?
Aviation Wireの記事 [aviationwire.jp]の情報を見つつ…・DBサーバが止まり、複数台動かすと不安定な状態になること・1台で動かせば正常動作することこれにより比較的早期に、1台での運用による仮復旧は出来たことでしょう。ここから障害の切り分けに入ります。状況的にまず最初にシステムのOSやソフトウェアが疑われたかもしれません。夜間にパッチなどを当てていないか、変なデータを入れていないか。故障の情報は入っていないため、スイッチやルータの設定ミス等も疑ったことでしょう。そこからパケットキャプチャ等で犯人を特定して、シスコが犯人であることをシスコに認識させるために情報を整理して…ということを考えるとよく1日で交換部材を確保できたなーと感心します。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy
素人にわかるように、解決の難しさを教えて (スコア:0)
素人考えだと、スイッチを交換すればすぐ回復できそうなように思えます。
たぶん、ハブほど簡単に交換できるものじゃないのだろうとは思いますが
こういった充分な資金力のある、大規模で信頼性が求められるシステムで
長時間、停止してしまうことを防ぐことは
それほど難しいことなのでしょうか?
Re:素人にわかるように、解決の難しさを教えて (スコア:1)
Aviation Wireの記事 [aviationwire.jp]の情報を見つつ…
・DBサーバが止まり、複数台動かすと不安定な状態になること
・1台で動かせば正常動作すること
これにより比較的早期に、1台での運用による仮復旧は出来たことでしょう。
ここから障害の切り分けに入ります。
状況的にまず最初にシステムのOSやソフトウェアが疑われたかもしれません。
夜間にパッチなどを当てていないか、変なデータを入れていないか。
故障の情報は入っていないため、スイッチやルータの設定ミス等も疑ったことでしょう。
そこからパケットキャプチャ等で犯人を特定して、シスコが犯人であることをシスコに認識させるために情報を整理して…
ということを考えるとよく1日で交換部材を確保できたなーと感心します。