アカウント名:
パスワード:
東証によると、1号機が何らかの理由でダウンした場合に2号機に自動で切り替わることは システム稼働前のテストで設計・開発した富士通とともに確認していた。 しかし今回、障害の原因を調べたところ、メモリー故障を理由として1号機が機能不全となった場合に、 2号機に自動で切り替わらないことが分かったという テストは富士通が主体となって実施しており、メモリーそのものを物理的に破壊するような実験はせず、 「疑似的に1号機の機能を喪失させるテストを実施し、2号機に切り替わることは確認していた」 なぜメモリ
異常処理のテストをどこまでやるかというのはなかなか難問で、
実際に機器を故障させてテストをするというケースは少ないのではないでしょうか。
1日に3兆円の取引をするシステムなんだからいろんなテストをやっても全然ペイできると思うんだけどなしかも24時間運用ってわけでもないし
テスト自体はやることに超したことはないですが、小規模なシステムならともかく大規模なシステムで網羅的にやるのは不可能に近いような。特に今回みたくハードウェアに起因するようなものの場合、そもそもそれって再現させられるの……?って話もありますしね。
なので、障害の早期検知と対応の迅速化とか影響範囲の最小化が方向性としてはとるべき道なのかなとも思いますね。
ただ、今回の件の場合どの時間までに復旧していれば全日取引不能にならなかったのかわかりませんが……。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー
原因 (スコア:4, 興味深い)
それはそれでわかるんだが (スコア:0)
異常処理のテストをどこまでやるかというのはなかなか難問で、
実際に機器を故障させてテストをするというケースは少ないのではないでしょうか。
1日に3兆円の取引をするシステムなんだからいろんなテストをやっても全然ペイできると思うんだけどな
しかも24時間運用ってわけでもないし
Re:それはそれでわかるんだが (スコア:1)
テスト自体はやることに超したことはないですが、小規模なシステムならともかく
大規模なシステムで網羅的にやるのは不可能に近いような。
特に今回みたくハードウェアに起因するようなものの場合、そもそもそれって
再現させられるの……?って話もありますしね。
なので、障害の早期検知と対応の迅速化とか影響範囲の最小化が方向性としては
とるべき道なのかなとも思いますね。
ただ、今回の件の場合どの時間までに復旧していれば全日取引不能にならなかった
のかわかりませんが……。