アカウント名:
パスワード:
AWSも電源トラブルだったようですが,データセンタにおいて電源廻りはウィークポイントになりやすいのでしょうかね?
オペレータが蹴躓いてコードを抜いちゃった系は置いといて.
データセンタは、極論すると「場所」と「電力」と「冷却」を売っている所になりますかね。その中で一番、メンテナンスが難しいところが電力周りになります。(冷却も電力を使いますが、最近は自然冷却を売りにしている所も多くなっているので分けました)
電力の部分についてはこんな感じの構成になります。かね?・電力会社(東京電力、東北電力など発電会社が分かれている、発電所が分かれている)・受電方式(2重、スイッチ、単など、発電所から建物が電気を受け取る線の冗長性)・自家発電機(燃料による自家発電。大体3時間から半日くらいもつケースが多いみたい)・UPS(蓄電池。億単位で揃えたとしても10分程度しか持たない。)・分電板(各部屋への電力分岐)
この中でデータセンタとして多いトラブルは「UPS故障」「分電板故障」「電力切替のミス」あたりですかね。以前にラックルームが煙でいっぱいになっていて、原因が分電板が燃えていたなんてことも。
で、UPSを使うケースというのは受電方式を切り替えるタイムラグや、自家発電機を回す為の時間を稼ぐ為というのが主になります。そのように稼動する為には障害が起こって気づいてから切替という訳にはいかず、ほぼ直結上に置かなければなりません。(交換の為に迂回路があったり、完全な直結であるというわけではありませんが)そのUPS自体で障害が起こると結構手がつけられません。ある意味では電線切っちゃったみたいにな事態になります。無論、UPSの冗長化も可能なのかもしれませんが、非常に高価になってしまうでしょう。(UPS系統を分けておき、一部UPSで障害がおきても影響が一部に留まる様な設計もあるかと思います。どこかで聞いたような?)
後は交換時や実障害時のトラブル。UPSの稼動試験などは、易々とは行えないので稼動時に切り替わりが上手く行われない事があります。各設備はそれぞれメンテナンスや交換で構成が変わりますので、その時に連動が切れてしまうのでしょう。(サーバリプレース時に切り替え試験ができない状態のまま、運用せざるを得ない状況だと考えてください)
まぁデータセンタのUPSは上記のように、受電方法の切り替えの時間稼ぎが主な役割です。データセンタにUPS経路が冗長化されているか確認したり、自分のラックにデータセンタ故障時の対策用UPSを置くのもありです。これはデータセンタのUPS故障が直るまで保たれなければならないので時間想定が難しいですが。以前にバッテリーが付いたサーバだかが話題にでましたが、あれはあれでいい発想だと思ってます。
# 運用畑が経験したり聞きかじった情報ですので100%信じないでください。職募集中。
>データセンタは、極論すると「場所」と「電力」と「冷却」を売っている所になりますかね。「通信回線」を売っているところじゃなかったんですか?
あまり詳しくはないのですが、一番お金がかかるところだったりするんじゃないんですかね。
電源ユニットってたいてい冗長化してるけど、UPSってあんまり冗長化してないイメージがあるけどそうでもない?サーバールームに行くとたまにUPSのバッテリーアラームがぴーぴー鳴ってるので音源探して連絡してるけど。#UPSは直接担当してないので運用はあまり知らない。
電源供給がA系-B系と冗長化されていて、サーバの電源も2重化されていました。設備点検で片系を落とすことになったのですが、だれしも冗長系があるから大丈夫だと思っていました。
A系を落としたところで、ブラックアウト。
サーバの電源ケーブルが両方ともA系に繋いでありましたとさ。
設置したときに、冗長系の動作試験ってしないものなのか?
冗長系は設計通りに設置して確認して終わりっぽい。重要な施設とかならきちんと試験するんでしょうけど。#DCならソコが重要だよね。
シロウトなのでよくわからないけど、UPSみたいな「こんなこともあろうかと!」ってやつは、完全には動作試験って難しいんじゃないんですかね??
動作試験しようとして(してみて)何か冗長系側に不具合があって本当にトラブルになりました・・・・なんてことがあってもシャレにならないですし・・・。
まあ、ちゃんとお金かければできるのはわかるんだけど・・・・それでもねぇ・・・。
掃除のおばちゃんが掃除機の電源確保のために抜いたではないのか?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
コンピュータは旧約聖書の神に似ている、規則は多く、慈悲は無い -- Joseph Campbell
電源トラブル (スコア:1)
AWSも電源トラブルだったようですが,データセンタにおいて電源廻りはウィークポイントになりやすいのでしょうかね?
オペレータが蹴躓いてコードを抜いちゃった系は置いといて.
Re:電源トラブル (スコア:3)
データセンタは、極論すると「場所」と「電力」と「冷却」を売っている所になりますかね。
その中で一番、メンテナンスが難しいところが電力周りになります。
(冷却も電力を使いますが、最近は自然冷却を売りにしている所も多くなっているので分けました)
電力の部分についてはこんな感じの構成になります。かね?
・電力会社(東京電力、東北電力など発電会社が分かれている、発電所が分かれている)
・受電方式(2重、スイッチ、単など、発電所から建物が電気を受け取る線の冗長性)
・自家発電機(燃料による自家発電。大体3時間から半日くらいもつケースが多いみたい)
・UPS(蓄電池。億単位で揃えたとしても10分程度しか持たない。)
・分電板(各部屋への電力分岐)
この中でデータセンタとして多いトラブルは「UPS故障」「分電板故障」「電力切替のミス」あたりですかね。
以前にラックルームが煙でいっぱいになっていて、原因が分電板が燃えていたなんてことも。
で、UPSを使うケースというのは受電方式を切り替えるタイムラグや、自家発電機を回す為の時間を稼ぐ為
というのが主になります。
そのように稼動する為には障害が起こって気づいてから切替という訳にはいかず、ほぼ直結上に置かなければなりません。
(交換の為に迂回路があったり、完全な直結であるというわけではありませんが)
そのUPS自体で障害が起こると結構手がつけられません。ある意味では電線切っちゃったみたいにな事態になります。
無論、UPSの冗長化も可能なのかもしれませんが、非常に高価になってしまうでしょう。
(UPS系統を分けておき、一部UPSで障害がおきても影響が一部に留まる様な設計もあるかと思います。どこかで聞いたような?)
後は交換時や実障害時のトラブル。
UPSの稼動試験などは、易々とは行えないので稼動時に切り替わりが上手く行われない事があります。
各設備はそれぞれメンテナンスや交換で構成が変わりますので、その時に連動が切れてしまうのでしょう。
(サーバリプレース時に切り替え試験ができない状態のまま、運用せざるを得ない状況だと考えてください)
まぁデータセンタのUPSは上記のように、受電方法の切り替えの時間稼ぎが主な役割です。
データセンタにUPS経路が冗長化されているか確認したり、自分のラックにデータセンタ故障時の対策用UPSを置くのもありです。
これはデータセンタのUPS故障が直るまで保たれなければならないので時間想定が難しいですが。
以前にバッテリーが付いたサーバだかが話題にでましたが、あれはあれでいい発想だと思ってます。
# 運用畑が経験したり聞きかじった情報ですので100%信じないでください。職募集中。
Re: (スコア:0)
>データセンタは、極論すると「場所」と「電力」と「冷却」を売っている所になりますかね。
「通信回線」を売っているところじゃなかったんですか?
Re:電源トラブル (スコア:2)
あまり詳しくはないのですが、一番お金がかかるところだったりするんじゃないんですかね。
Re:電源トラブル (スコア:1)
電源ユニットってたいてい冗長化してるけど、UPSってあんまり冗長化してないイメージがあるけどそうでもない?
サーバールームに行くとたまにUPSのバッテリーアラームがぴーぴー鳴ってるので音源探して連絡してるけど。
#UPSは直接担当してないので運用はあまり知らない。
Re: (スコア:0)
冗長化はしてあったけどいざって時にちゃんと動かなかった、ということのようで。
てゆーか、ファーストサーバと同列に扱うのは微妙な気が。
Re: (スコア:0)
電源供給がA系-B系と冗長化されていて、サーバの電源も2重化されていました。
設備点検で片系を落とすことになったのですが、だれしも冗長系があるから大丈夫だと思っていました。
A系を落としたところで、ブラックアウト。
サーバの電源ケーブルが両方ともA系に繋いでありましたとさ。
設置したときに、冗長系の動作試験ってしないものなのか?
Re:電源トラブル (スコア:1)
冗長系は設計通りに設置して確認して終わりっぽい。
重要な施設とかならきちんと試験するんでしょうけど。
#DCならソコが重要だよね。
Re: (スコア:0)
シロウトなのでよくわからないけど、UPSみたいな「こんなこともあろうかと!」って
やつは、完全には動作試験って難しいんじゃないんですかね??
動作試験しようとして(してみて)何か冗長系側に不具合があって本当にトラブルに
なりました・・・・なんてことがあってもシャレにならないですし・・・。
まあ、ちゃんとお金かければできるのはわかるんだけど・・・・それでもねぇ・・・。
Re: (スコア:0)
掃除のおばちゃんが掃除機の電源確保のために抜いたではないのか?