KDDIのIaaS『KCPS』で一部ストレージ障害、完全復旧には時間が必要 7
ストーリー by nagazou
障害 部門より
障害 部門より
1月28日午前4時20分ごろから、KDDIのクラウドサービス「KDDI クラウドプラットフォームサービス」で障害が発生している。リージョンを構成するサーバ群の一つである「jp2-east05」のストレージが故障したことで、ユーザーがサービスを使えない状態という。この影響で同サービスを利用していた葛飾区立図書館ホームページ及び葛飾区立図書館電子書籍サービスを利用できないなどの影響が出ていることが報じられている。葛飾区では2日の午前8時ごろ復旧予定であると告知している(KCPS設備の一部ストレージ障害について、ITmedia、葛飾区立図書館ホームページ障害発生のお知らせ、日経クロステック)。
2月1日の17時時点のKDDI側の発表によれば、原因は特定済みで、29日に仮想ルーターを再作成して対応しているそうだ。現在はストレージの新規構築による復旧処理を進めているとのこと。新規ストレージ構築に関しては30日に終了し、新規ストレージへのデータ移行を進めている最中としている。これには最長6日間を要する見込みだそうだ。
2月1日の17時時点のKDDI側の発表によれば、原因は特定済みで、29日に仮想ルーターを再作成して対応しているそうだ。現在はストレージの新規構築による復旧処理を進めているとのこと。新規ストレージ構築に関しては30日に終了し、新規ストレージへのデータ移行を進めている最中としている。これには最長6日間を要する見込みだそうだ。
リージョン跨ぎで冗長構成組んでなかったのかよと (スコア:0)
まぁ、組んでないんだろうな。
AWSの常識は世間の常識ではないって思い知らされることが何気に多い。
Re:リージョン跨ぎで冗長構成組んでなかったのかよと (スコア:1)
そもそも「ゾーン」が何を指しているかがよくわからないですね…
そのゾーン内でどこまで冗長化されていたのやら
※KCPS Ver.2では別リージョンで冗長化してねっていうのは読み取れましたが、jp2-eastに対してjp2-westの空き少なくないですかねぇ
AWSだとマルチAZの冗長化は基本として、DR対策としてマルチリージョンもいろいろ構成できるので、ケースに応じて考えてねっていう親切なドキュメントがあって助かります
https://docs.aws.amazon.com/ja_jp/wellarchitected/latest/reliability-p... [amazon.com]
Re: (スコア:0)
リージョン跨ぎで冗長するしないは ユーザーが指定する内容だから、ユーザーがしていなかったってことでしょうね。AWS利用ユーザーの常識は世間の常識ではない
Re: (スコア:0)
落ちたら困るような用途ならともかく自治体の図書館でそこまで予算割けないよなあ。
とはいえオンプレにしたら解決できる問題でもないのでトラブル発生時にどこまで許容できるかが課題。
その辺わかってなくてSLA100%を要求するアホ客も少なからず存在するけど。
Re: (スコア:0)
要求するだけならタダなんだから、要求してわずかでも改善する可能性を考慮すると要求する方が賢い。
予算取れなかったからかな (スコア:0)
冗長構成取れば、その分だけ費用が発生します。
その予算が取れなかったんじゃないかな。
Re: (スコア:0)
Azureみたいに全リージョンで障害起こしてたら何にもならんけどね