アカウント名:
パスワード:
ANAのシステムがダウンしたときはCiscoのスイッチ故障が原因で、世界初の珍しい原因だと強調していたけれど、ミッションクリティカルなシステムで使うスイッチの構成じゃないと思った。明らかに予算をケチったのが原因だろうと。
普通はスイッチが1台故障しても止まらないように構築するものだが、安くて機能不足のスイッチを使って障害時に自動的に切り替えるように作ったつもりになっていたところ、切り替わらなかったのが原因だったね。
人や技術にお金をかけない会社は、いつかしっぺ返しで損害を出したりするんだよ。
あの件ではそもそも冗長は取られてたし、事前テストでの問題洗い出しも行われていた。その上でシステム死亡時の代替手段も用意され訓練されていて実践までされたわけで。あれ以上が必要だというプレゼンができるというなら見せてほしいね。これでとにかく最高のものを使う以外ありませんとかこのメーカーしかありませんとか言いだすなら最悪の無能だぞ。
どんな冗長システムでも、死んだことを認識できない死に方(ANAの例のような不調系の死に方)をしたら自動的に切り替えるなんてできないし、本当の意味で万全な体制をとろうとするなら高位レイヤ側まで全部含めて対応するしかない。そんなことしたら機器更新のメンテナンスまで考えるとコストがとんでもないことになるのは明白で、そこまで金かけられるのは命かかってる系くらいなもん。所詮予約系システムだからあれでもかなり頑張ってた方だと思うがな。
いやいやいやいや、あれを冗長っていっちゃダメだろ。故障時にスクリプトでスタンバイしている予備機にきりかえてるだけじゃん。
素人がすぐ考え付く構成でも、スイッチをスタッキングにしておいて、サーバーはbondingとかで両方のスイッチと接続しておくってのが最低限だよね。そんなに難しいものじゃない。
あれ以上が必要だってプレゼンするまでもなく、この一行の説明だけで十分。
あとなあ、ANAが使ってた構成と比べて格段に高いというわけでもないんだよ。
報告書によれば、トラブル対応の過程で同機種に交換しても同様の問題が発生したそうで。つまり仮にbondingしてあったとしても両方とも死んで終了なパターンだったわけだがw
事前テストで潜在的なバグを見つけたりもしてたという話といい、あれは本当に運がなかったとしか言いようがないトラブル。しいて言うなら、冗長系は別機種を使うべきだった、くらいなもんだが、現実問題としてそんな非対称構成にgo出せる奴はそうそういねえだろw
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲはアレゲを呼ぶ -- ある傍観者
ANAの障害の場合 (スコア:0)
ANAのシステムがダウンしたときはCiscoのスイッチ故障が原因で、世界初の珍しい原因だと強調していたけれど、ミッションクリティカルなシステムで使うスイッチの構成じゃないと思った。
明らかに予算をケチったのが原因だろうと。
普通はスイッチが1台故障しても止まらないように構築するものだが、安くて機能不足のスイッチを使って障害時に自動的に切り替えるように作ったつもりになっていたところ、切り替わらなかったのが原因だったね。
人や技術にお金をかけない会社は、いつかしっぺ返しで損害を出したりするんだよ。
Re: (スコア:2, 興味深い)
あの件ではそもそも冗長は取られてたし、事前テストでの問題洗い出しも行われていた。
その上でシステム死亡時の代替手段も用意され訓練されていて実践までされたわけで。
あれ以上が必要だというプレゼンができるというなら見せてほしいね。これでとにかく
最高のものを使う以外ありませんとかこのメーカーしかありませんとか言いだすなら
最悪の無能だぞ。
どんな冗長システムでも、死んだことを認識できない死に方(ANAの例のような不調系の
死に方)をしたら自動的に切り替えるなんてできないし、本当の意味で万全な体制を
とろうとするなら高位レイヤ側まで全部含めて対応するしかない。そんなことしたら
機器更新のメンテナンスまで考えるとコストがとんでもないことになるのは明白で、
そこまで金かけられるのは命かかってる系くらいなもん。所詮予約系システムだから
あれでもかなり頑張ってた方だと思うがな。
Re:ANAの障害の場合 (スコア:1)
いやいやいやいや、あれを冗長っていっちゃダメだろ。
故障時にスクリプトでスタンバイしている予備機にきりかえてるだけじゃん。
素人がすぐ考え付く構成でも、スイッチをスタッキングにしておいて、サーバーはbondingとかで両方のスイッチと接続しておくってのが最低限だよね。
そんなに難しいものじゃない。
あれ以上が必要だってプレゼンするまでもなく、この一行の説明だけで十分。
あとなあ、ANAが使ってた構成と比べて格段に高いというわけでもないんだよ。
Re: (スコア:0)
報告書によれば、トラブル対応の過程で同機種に交換しても同様の問題が発生したそうで。
つまり仮にbondingしてあったとしても両方とも死んで終了なパターンだったわけだがw
事前テストで潜在的なバグを見つけたりもしてたという話といい、あれは本当に運が
なかったとしか言いようがないトラブル。しいて言うなら、冗長系は別機種を使うべき
だった、くらいなもんだが、現実問題としてそんな非対称構成にgo出せる奴はそうそう
いねえだろw