アカウント名:
パスワード:
2台ともダメになってたら止めるしかないわけ?
証券取引所システムのバックアップがたった一系統しかないとは思えません。
プライマリセンタ2系統とセカンダリセンタ (機能縮小版) 2系統の構成で、プライマリセンタ1系統が故障したがプライマリセンタ2系統に切り替わらず、セカンダリセンタを使用する決定もしなかった。
日本取引所グループのBCP [jpx.co.jp]には、「セカンダリセンタへ切り替える場合、売買・取引の再開は24時間以内を目標とするが、当日中の再開は行わない」と書かれている。当日中に原因箇所の特定・除去など再起動の目処が立たなかった場合は、翌日はセカンダリセンタで売買・取引を再開するつもりだったと考えられる。
セカンダリセンタはコールドスタンバイで立ち上げも少々時間を要するとかも言ってたっけか。ホットスタンバイな2号機と無停止で交代できた場合は良しとして、それ以外は再開によるトラブル防止の為に状況分析と再開影響分析が優先されるんだろうね。
今回も1号機直して午後から再開は可能だったけど、取引の都合上問題が起きそうなので避けた結果の一日停止だし。障害対応ルールは二次災害予防の観点でかなり慎重のようだ。
取引データのバックアップはもっと強力だと思いますが、情報配信システムならこんなものでしょう。平日の9:30-11:30と12:30-15:00が取引時間で、何年かに一度は何かしら取引停止のトラブルがあります。そもそも365日24時間いつでも換金する必要のある資産を株式で保有するのは間違いでしょう。
それが気に入らないなら3重にするしかないですね。それでも気に入らないなら4に。それでも…。RAIDは何台で構成してあれば気が済みますか?っていうのと同じこと。絶対に止まらないシステムなど存在しない。隕石が落ちてきたら止まるし。どこで線を引くかの問題で、議論するならその線引きは妥当か、何故妥当と言えるのかという話になる。でも万人が納得するのはきっと不可能でしょうね。コストが妥当かという問題もあるからね。
何重にしたところでそもそも切り替わらないのでは意味がないと思うが
そうだよ
# だから3台目と4台目と...N台目も買ってください
そしてRAIDコントローラーが死亡。
待機系の故障に気付かなくて障害が発生した瞬間に詰んでしまうのは稀によくある話。似たようなのにRAIDの2台目のHDDが壊れてやっと障害に気付いたが時既にお寿司というのがある。
1台目の故障に気づいてても、予算無いから交換用HDDの購入はちょっとまってといわれてるうちに、2台目が無事死亡するケースもあるとか...
一台目故障から交換再構築完了まで(場合によっては再構築開始前から)負荷が上昇するから、実は故障率が独立してなくて実際の冗長性は足りてない、とかもまま聞く話。
アレイはRAID5+ホットスペア→1台死亡→自動リビルド開始→高負荷で2台目死亡
数回サルベージを経験しましたとも、、、。
RAIDって構成しているHDDが、
同じスペック(多くの場合、同じメーカ製の同じ型番)で、製造時期が近くて(製造スロットも同じだったり、近かったり)、同じ筐体内で(周囲の温度条件同じ)、同じアクセス頻度で利用されているんだから、
ひとつ逝ったら、他のも近いうちに逝っちゃうリスクは高いと思わなくちゃいけないですよね。
NetAppやらEMCやらはそこらへんは少しは考えていて、ファームウェアを独自のものに変更してセクタ数等をアライメントした複数社・製造時期が近くはあるが別ロットのHDD/SSDを1セット内に搭載しています。なのでHDD/SSDに搭載するファームウェアで共通のやらかしがない限りはある程度ばらけるように調整して出荷しています。
セットで届くのであまり機会がないかもしれませんが、スロットから外してみると面白いですよ。2シェルフぐらいだとHDDはWD/HGST/Seagateのうち2社になるパターンがやっぱり多いですが、1ラック以上の場合だと今その会社で取り扱っているストレージでの仕入れ元が揃い踏みすることもあります。
以前、FTサーバで待機系のファイルシステムがReadOnlyになっていることに半年以上気付かなかったことがあった。アプリをバージョンアップしようとして初めて気付いたw
稼働系が故障しなくてホント助かった…
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
「科学者は100%安全だと保証できないものは動かしてはならない」、科学者「えっ」、プログラマ「えっ」
これさ (スコア:0)
2台ともダメになってたら止めるしかないわけ?
Re:これさ (スコア:2)
証券取引所システムのバックアップが
たった一系統しかないとは思えません。
Re:これさ (スコア:1)
プライマリセンタ2系統とセカンダリセンタ (機能縮小版) 2系統の構成で、プライマリセンタ1系統が故障したがプライマリセンタ2系統に切り替わらず、セカンダリセンタを使用する決定もしなかった。
日本取引所グループのBCP [jpx.co.jp]には、「セカンダリセンタへ切り替える場合、売買・取引の再開は24時間以内を目標とするが、当日中の再開は行わない」と書かれている。
当日中に原因箇所の特定・除去など再起動の目処が立たなかった場合は、翌日はセカンダリセンタで売買・取引を再開するつもりだったと考えられる。
Re: (スコア:0)
セカンダリセンタはコールドスタンバイで立ち上げも少々時間を要するとかも言ってたっけか。
ホットスタンバイな2号機と無停止で交代できた場合は良しとして、
それ以外は再開によるトラブル防止の為に状況分析と再開影響分析が優先されるんだろうね。
今回も1号機直して午後から再開は可能だったけど、
取引の都合上問題が起きそうなので避けた結果の一日停止だし。
障害対応ルールは二次災害予防の観点でかなり慎重のようだ。
Re: (スコア:0)
取引データのバックアップはもっと強力だと思いますが、情報配信システムならこんなものでしょう。平日の9:30-11:30と12:30-15:00が取引時間で、何年かに一度は何かしら取引停止のトラブルがあります。そもそも365日24時間いつでも換金する必要のある資産を株式で保有するのは間違いでしょう。
Re:これさ (スコア:1)
それが気に入らないなら3重にするしかないですね。それでも気に入らないなら4に。それでも…。
RAIDは何台で構成してあれば気が済みますか?っていうのと同じこと。
絶対に止まらないシステムなど存在しない。隕石が落ちてきたら止まるし。
どこで線を引くかの問題で、議論するならその線引きは妥当か、何故妥当と言えるのかという話になる。
でも万人が納得するのはきっと不可能でしょうね。コストが妥当かという問題もあるからね。
Re: (スコア:0)
何重にしたところでそもそも切り替わらないのでは意味がないと思うが
Re: (スコア:0)
そうだよ
# だから3台目と4台目と...N台目も買ってください
Re: (スコア:0)
そしてRAIDコントローラーが死亡。
Re: (スコア:0)
待機系の故障に気付かなくて障害が発生した瞬間に詰んでしまうのは稀によくある話。
似たようなのにRAIDの2台目のHDDが壊れてやっと障害に気付いたが時既にお寿司というのがある。
Re: (スコア:0)
1台目の故障に気づいてても、予算無いから交換用HDDの購入はちょっとまってといわれてるうちに、2台目が無事死亡するケースもあるとか...
Re: (スコア:0)
一台目故障から交換再構築完了まで(場合によっては再構築開始前から)負荷が上昇するから、
実は故障率が独立してなくて実際の冗長性は足りてない、とかもまま聞く話。
Re:これさ (スコア:1)
アレイはRAID5+ホットスペア
→1台死亡
→自動リビルド開始
→高負荷で2台目死亡
数回サルベージを経験しましたとも、、、。
Re: (スコア:0)
RAIDって構成しているHDDが、
同じスペック(多くの場合、同じメーカ製の同じ型番)で、
製造時期が近くて(製造スロットも同じだったり、近かったり)、
同じ筐体内で(周囲の温度条件同じ)、
同じアクセス頻度で利用されているんだから、
ひとつ逝ったら、他のも近いうちに逝っちゃうリスクは高いと
思わなくちゃいけないですよね。
Re: (スコア:0)
NetAppやらEMCやらはそこらへんは少しは考えていて、
ファームウェアを独自のものに変更してセクタ数等をアライメントした複数社・製造時期が近くはあるが別ロットのHDD/SSDを1セット内に搭載しています。
なのでHDD/SSDに搭載するファームウェアで共通のやらかしがない限りはある程度ばらけるように調整して出荷しています。
セットで届くのであまり機会がないかもしれませんが、スロットから外してみると面白いですよ。
2シェルフぐらいだとHDDはWD/HGST/Seagateのうち2社になるパターンがやっぱり多いですが、
1ラック以上の場合だと今その会社で取り扱っているストレージでの仕入れ元が揃い踏みすることもあります。
Re: (スコア:0)
スロットから外すのは、納入されて開梱直後の電源を入れる前にして下さい。
運用状態でいきなり外すと、故障と判断されCEが特殊な処理をしないと再使用できません。
そういう装置はLANにつながり、Webインターフェースの管理ソフトが動作してます。
スロットから外さずに、管理ソフト(運用管理担当者に相談して)で確認して下さい。
Re: (スコア:0)
以前、FTサーバで待機系のファイルシステムがReadOnlyになっていることに
半年以上気付かなかったことがあった。
アプリをバージョンアップしようとして初めて気付いたw
稼働系が故障しなくてホント助かった…