アカウント名:
パスワード:
大規模トラブル発生した場合、通常業務に必要な作業以外の更新等は一時停止して、手順とか更新内容の再確認とかするんじゃないのかな?
普通は止めるよね。特に作業手順とリスクは全洗い直しで。経営者やCIOが自社システムと委託先を過信してるのかな。
システム動いてる状態で更新とか細心の注意が必要なのに、影響範囲見積もり失敗で無関係なサービス止める事故が短期間に2回は流石に。
ここ最近のみずほ銀行、「前回や予備機で出来たから本番機で今回も出来るだろう」みたいな、だろう運用状態な事故に見えておっかない。28日の見直しが「メモリ不足で止まった。5倍にしたからよし。」で止まってしまったのか?水平展開を後回しにしちゃったか?実施前に、止まる可能性を事前に抽出してサービスの事前一部停止やリカバリー体制を構築出来なかった想定能力が足りていない運用体制が大問題なのに。まさか、仕様や設計書とプログラムの実態が別物になっていて、作業計画書の実施前レビューが役に立たないのか?それとも、共有リソース(CPU、メモリ、ストレージ等性能低下)の見積もりが古くて役に立ってないのか?非定常作業が過負荷や故障のトリガーになって他システムがタイムアウトや異常停止、異常終了、系切り替え発生みたいな別の障害を発生させたり波及しないかの見積もりが出来てないのか?止めないことで制御不能な顧客の利用が原因で作業が失敗になったか?
ここ最近の2件は、休眠定期預金口座のリストアップだからサーバー以外に影響でないだろうでATMで大規模障害を起こす事故。カードローンのプログラムだから他に影響でないだろうで定期預金業務が止まる事故。どっちも定期預金とそこの派生に影響が出ると思ってなくて事故ってる。
素人考えだと、休眠定期口座のリストアップも、カードローンの利息回りも普通口座の残高不足したら定期口座から引っ張るから間接的とはいえシステムかモジュールが結合してるはずで、影響の程度は違えど影響が無いはず無いのだが。
どうしても必要な更新ならもう、経営判断で「申し訳ないがサービスを一時停止します」するか、利息は後日請求にするみたいに、e-口座以外もサービス開始や更新見送りしないとまた事故りそう。
普通はこの程度の事故はポロポロ発生していて、特にニュースにもなっていないけど、たまたま大事故の直後だから報道され、こうしてスラドにも取り上げられているのでは?
(民営化前に)「ゆうちょATMの一部で1時間前後使えないトラブルが発生」みたいなニュースを何度か見たこともあるので、この規模なら通常でもニュースになるレベルだよ。あと金融庁への報告も必須
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
未知のハックに一心不乱に取り組んだ結果、私は自然の法則を変えてしまった -- あるハッカー
普通は (スコア:4, すばらしい洞察)
大規模トラブル発生した場合、通常業務に必要な作業以外の更新等は一時停止して、
手順とか更新内容の再確認とかするんじゃないのかな?
Re:普通は (スコア:2, 興味深い)
普通は止めるよね。
特に作業手順とリスクは全洗い直しで。
経営者やCIOが自社システムと委託先を過信してるのかな。
システム動いてる状態で更新とか細心の注意が必要なのに、影響範囲見積もり失敗で無関係なサービス止める事故が短期間に2回は流石に。
ここ最近のみずほ銀行、「前回や予備機で出来たから本番機で今回も出来るだろう」みたいな、だろう運用状態な事故に見えておっかない。
28日の見直しが「メモリ不足で止まった。5倍にしたからよし。」で止まってしまったのか?水平展開を後回しにしちゃったか?
実施前に、止まる可能性を事前に抽出してサービスの事前一部停止やリカバリー体制を構築出来なかった想定能力が足りていない運用体制が大問題なのに。
まさか、仕様や設計書とプログラムの実態が別物になっていて、作業計画書の実施前レビューが役に立たないのか?
それとも、共有リソース(CPU、メモリ、ストレージ等性能低下)の見積もりが古くて役に立ってないのか?
非定常作業が過負荷や故障のトリガーになって他システムがタイムアウトや異常停止、異常終了、系切り替え発生みたいな別の障害を発生させたり波及しないかの見積もりが出来てないのか?
止めないことで制御不能な顧客の利用が原因で作業が失敗になったか?
ここ最近の2件は、休眠定期預金口座のリストアップだからサーバー以外に影響でないだろうでATMで大規模障害を起こす事故。
カードローンのプログラムだから他に影響でないだろうで定期預金業務が止まる事故。
どっちも定期預金とそこの派生に影響が出ると思ってなくて事故ってる。
素人考えだと、休眠定期口座のリストアップも、カードローンの利息回りも普通口座の残高不足したら定期口座から引っ張るから間接的とはいえシステムかモジュールが結合してるはずで、影響の程度は違えど影響が無いはず無いのだが。
どうしても必要な更新ならもう、経営判断で「申し訳ないがサービスを一時停止します」するか、利息は後日請求にするみたいに、e-口座以外もサービス開始や更新見送りしないとまた事故りそう。
Re: (スコア:0)
普通はこの程度の事故はポロポロ発生していて、特にニュースにもなっていないけど、たまたま大事故の直後だから報道され、こうしてスラドにも取り上げられているのでは?
Re: (スコア:0)
(民営化前に)「ゆうちょATMの一部で1時間前後使えないトラブルが発生」みたいなニュースを何度か見たこともあるので、この規模なら通常でもニュースになるレベルだよ。
あと金融庁への報告も必須