アカウント名:
パスワード:
素人考えだと、スイッチを交換すればすぐ回復できそうなように思えます。
たぶん、ハブほど簡単に交換できるものじゃないのだろうとは思いますがこういった充分な資金力のある、大規模で信頼性が求められるシステムで
長時間、停止してしまうことを防ぐことはそれほど難しいことなのでしょうか?
switchに問題があることがわかれば、あとは簡単。代替機に交換って、きっと問題のあったswitchを落とすだけじゃないかな。ふつうだったら自動的にfail overすべきところを、「不安定な状態で動作していた」ためにそれができなかったように見える。
switchでもrouterでもSANでもそういうによくやられてる。
現れるんじゃない?現れるからこそ、通信に影響が出るわけでしょう。
しかし、それに気づくことや、気づいてから原因を特定することは、口で言うほど簡単なことじゃない、って話でしょう。
よくありがちな通信不具合に関しては、「サーバ側で実装」されてますね。たとえば、TCPは、途中の経路でパケットがロスするという通信不具合に対して、それを回復するための再送と言う手段が実装されてますね。
今回の仕組みがTCPでカバーできるものだったのか、そもそもTCPを使っていたのかは、私は知りませんが、珍しい通信障害だったらしいので、それに対してサーバ側で準備しておけ、ってのは無理筋かな、と思います。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
計算機科学者とは、壊れていないものを修理する人々のことである
素人にわかるように、解決の難しさを教えて (スコア:0)
素人考えだと、スイッチを交換すればすぐ回復できそうなように思えます。
たぶん、ハブほど簡単に交換できるものじゃないのだろうとは思いますが
こういった充分な資金力のある、大規模で信頼性が求められるシステムで
長時間、停止してしまうことを防ぐことは
それほど難しいことなのでしょうか?
Re: (スコア:0)
switchに問題があることがわかれば、あとは簡単。
代替機に交換って、きっと問題のあったswitchを落とすだけじゃないかな。
ふつうだったら自動的にfail overすべきところを、
「不安定な状態で動作していた」ためにそれができなかったように見える。
switchでもrouterでもSANでもそういうによくやられてる。
Re: (スコア:1)
Re:素人にわかるように、解決の難しさを教えて (スコア:1)
現れるんじゃない?
現れるからこそ、通信に影響が出るわけでしょう。
しかし、それに気づくことや、気づいてから原因を特定することは、口で言うほど簡単なことじゃない、って話でしょう。
Re:素人にわかるように、解決の難しさを教えて (スコア:1)
Re:素人にわかるように、解決の難しさを教えて (スコア:1)
よくありがちな通信不具合に関しては、「サーバ側で実装」されてますね。
たとえば、TCPは、途中の経路でパケットがロスするという通信不具合に対して、それを回復するための再送と言う手段が実装されてますね。
今回の仕組みがTCPでカバーできるものだったのか、そもそもTCPを使っていたのかは、私は知りませんが、珍しい通信障害だったらしいので、それに対してサーバ側で準備しておけ、ってのは無理筋かな、と思います。