パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

WebARENA のクラウドサービスに障害、発生から 4 日たっても復旧未定」記事へのコメント

  • いくら運用コストが低いとしても、導入前に、障害発生時にかかる損失を加えて考慮すべきだ!
    と考える人がこれからは増えるかもしれませんが、
    大事なのは、障害対策に加えて、障害が起こっても適切に対処できる会社かどうかを調べることかもかも?

    #なんだかどっかで聴いた話。。。
    • 結果として発生してしまうと分かりますが,
      事前に障害が起きる確率とか復旧所要時間の期待値なんて
      わかりますかね?

      提供している事業者側自身ですらわからないんじゃない?

      親コメント
      • 業務系システムの設計ではかなり古典的(1970年代からある)な物ですよ. 一般的な故障管理の延長線上にあって, 統計的な故障発生曲線(いわゆるバスタブ曲線)から, 一定の確率で故障が起こるタイミングで故障が発生する以前に交換を行います. これを予防保守と言います.

        コンピュータシステムではさらに自身のエラー発生頻度をモニタリングすることにより, 故障の前兆を事前にある程度知ることができます. これは一般にRAS機能と呼ばれ, メインフレームやサーバマシン, あるいは工業用PC等でサポートされています. ただ部品レベルで見れば, ハードディスクにおけるS.M.A.R.T [mycom.co.jp]も一種のRAS機能であり, きっちりとモニターしていれば, そして統計的なデータの蓄積があれば, 一定の確率および停止時間で故障を回避することが可能です.

        親コメント
        • by Anonymous Coward

          いや、いろいろ手法とかモニタする手段とかはあると思うのだけど,
          今回だって全く無策というわけではなかっただろうに
          結局トラブルは起きてるわけですよね.

          他所だって本当に全く問題ないといえるのかどうかは分からないわけで
          (いままでたまたまクリティカルにヒットしなかっただけかもしれない).

          そもそもそんなに「信頼できるかどうかは事前に分かりますよ」なんて
          いえるんなら,もっと信頼性を定量的に評価して
          (さらに一部ベンダは得意げにそれを喧伝してもよさそう)
          システム導入時に参考にできたって良いように思うのですが,
          そうはなってない…

          • by Anonymous Coward

            教科書に出るような内容で喧伝てw

            今回は運用がヘボなだけでしょ。

      • by Anonymous Coward

        それができないようじゃコンサルは無理。
        ハッタリだけの奴が多いのも事実では有るが。

最初のバージョンは常に打ち捨てられる。

処理中...