さくらのクラウドのオブジェクトストレージ障害、発生から1ヶ月以上が過ぎても継続中 29
ストーリー by hylom
どうしてこうなった 部門より
どうしてこうなった 部門より
あるAnonymous Coward 曰く、
先月9日よりさくらインターネットのクラウドサービス「さくらのクラウド」のオブジェクトストレージで障害が発生している模様(さくらインターネットによる発表)。9月29日にはオブジェクトの取得、10月3日はアップロードおよび削除について受付を再開しているが、まだ完全復旧には至っていない様子。
故障機器交換に伴うリビルドが原因で内部負荷が上昇したのが原因だという。オブジェクトストレージでは7月にも障害が発生しており、7月末には新規バケットの申込みを停止していた(7月31日の告知)。
これとは直接は関係ないんですが (スコア:1)
日本郵政が満を持して始めた各種フリマサイトとの連携機能であるe発送のコンビニ受付が開始一週間ほどで大規模な障害発生、
そこから今日までで三ヶ月以上が経過しているのですが全く復旧する気配がありません。
あらゆるシステムが大規模化、複雑化していく中で、一度障害が発生すると原因すら突き止められない、
突き止めてもすぐには対処できないという時代になりつつあるのかも知れませんね。
Re: (スコア:0)
昔から日本では
>突き止めてもすぐには対処できないという時代になりつつあるのかも知れませんね。
突き止めても、すぐには公表できないという事はありましたね。
いかに責任問題から逃れられる or 誰かに押し付ける合意が出来ているかが
日本では顧客対応より優先されてきましたから。
Re: (スコア:0)
>大規模化、複雑化していく中で、一度障害が発生すると・・・
肯定、ストレージの容量に対してインターフェースの速度が追いついていない
気がする。「(実際に)なんかあったら終わり」システムも多いんではないだろうか。
Re: (スコア:0)
そんなことはC++でもうみんなわかりきっているかと思ってました。
あらゆるクラスが(継承により)大規模化、複雑化していくなかで一度エラーが発生すると原因すら突き止められない。
突き止めてもすぐには対処できない、というか対処できたのかどうかの検証が大変という……。
Re: (スコア:0)
歴史は繰り返すというやつでしょうか
昔はJavaでも同じようなことが言われてましたね
「予定通りに終らない、いつまでたっても開発中」とか
Re:10月31日に復旧するそうですよ (スコア:0)
2017年6月20日(火)から運用を開始した「e発送サービス」について、同年6月28日(水)に発生した当社システムの不具合により、ローソン店舗での本サービスを利用したゆうパック・ゆうパケットの取扱いを停止していましたが、再開の準備が整いましたので、10月31日(火)10:00から再開します。
長期間に渡り、ご利用のお客さまおよび関係の皆さまに多大なるご迷惑をお掛けしましたことを心よりお詫び申し上げます。
障害対策に対するユーザーの評価 (スコア:0)
サクラチル
Re: (スコア:0)
うーん、おいらはVPSしか使ってないからのう。
さしあたりトラブってないからどうでもいいさ。
# データのバックアップだけは常に取ってるが
Re: (スコア:0)
このサービスのユーザは「さくら」しかいません
ググったらオブジェクトストレージ比較でさくらのオブジェクトストレージが
お得、とか言っている人が(2017/10/04作成)価格の比較だけならそうなのかもしれないけどさ
使ってみての比較をして欲しいかな
事故を頻繁におこし、さらに解消までこんなに時間がかかるストレージシステムなんて
幾ら安くても怖くて使えないだわさ
実テストしていなかった。ってことかな (スコア:0)
>オブジェクトを分割し、その消失訂正符号と共に
>複数のサーバへ分散配置することで、複数のサーバ故障にも耐える高いデータ保護
>性能を実現しております。
ところが
>機器故障への対応にてシステム内部負荷が増大し、外部よりアクセス
>できない状態に至りました。
理屈はわかるし、正直に報告している点は評価すべきだが、
準備不足だった。ってことかな。いやまぁ自分のところでも調査しておいたほうが良いかなとおもた。
Re: (スコア:0)
準備不足というかテスト不足?
Re: (スコア:0)
さすがにテストはしてると思います。想定を大幅に上回る申し込みor利用があったんじゃないでしょうか。
嬉しい悲鳴が、阿鼻叫喚にシフトすると言うたまに良くあるパターンに見えます。
Re: (スコア:0)
のわりには話題になっていませんでした。
#複雑な料金体系が原因?
ストレージに弱いんですかね? (スコア:0)
さくらのクラウド自体もスタート直後にストレージが過負荷で不安定になって、かなり長い期間無料になっていました。その時の原因は枯れてない新しいアプライアンスを採用したら不具合でたって感じでしたが。ストレージ責任者に新しい物好きの人でもいるんでしょうか?
Re: (スコア:0)
> さくらのクラウド自体もスタート直後にストレージが過負荷で不安定になって、かなり長い期間無料になっていました。その時の原因は枯れてない新しいアプライアンスを採用したら不具合でたって感じでしたが。
いやそれOracleに騙されてクソストレージを売りつけられたからでしょ
Re: (スコア:0)
さすがにないわー
バージョンアップじゃなくて、自社どころか世界中探しても殆ど実績の無い、新規システム自分で入れておいてOracleに騙されましたとか
中の人か信者か知らないけど、まともなインフラ屋の知識があればさくらを擁護できないでしょ
まあ、トラブル後の真摯な説明や長期間の無料化等の対応は評価できるけどね
Re:ストレージに弱いんですかね? (スコア:1)
> 自社どころか世界中探しても殆ど実績の無い、新規システム自分で入れておいてOracleに騙されましたとか
オラクルが自社のPRで「さくらインターネットで採用されました!」って言っちゃうフラッグシップモデルやぞ?
まぁさくらを擁護できないというのは正しい
SUNの時代からハードウェアは(ソフトウェアもだけど)ゴミだったから、まず最初に除外すべき会社の製品だからね
Re: (スコア:0)
どの製品にも詳細な既知の不具合リストがついてくるから間違いがない
# そのタイトルが「新機能リスト」なのはちょっと不親切だけどね
Re: (スコア:0)
Re: (スコア:0)
グレードによってパッチが送られなかったりするし。
Re: (スコア:0)
Re: (スコア:0)
SRに調査依頼送ってもまともな回答が来たためしが無いんだが???
Re: (スコア:0)
新しい物を導入するのは良い。トラブルになるのも良い。ただトラブルになる前提でトラブルを吸収できるように出来ないなら新しい物を導入するのはやめたほうが良い。
Re: (スコア:0)
いや、それはソフト屋の発想。インフラ屋はそれじゃだめでしょ。
トラブル吸収できるからって、トラブル発生する可能性の高い新しい物を入れるとかありえない。
ハードはソフトと違って、トラブルありました、じゃあ最新版に総入れ替えで修正完了って訳には行かないんだから。
Re: (スコア:0)
もはやインフラはハードではない時代だから。
くらうどで (スコア:0)
毒を喰らうど・・・・・と
# 石ぶつけないで!
Re:くらうどで (スコア:2)
石さえももったいない。
RAID5のリビルド負荷と同じ? (スコア:0)
規模が全然違うけど予測できるでしょ。
復旧しました→障害が発生しました (スコア:0)
10月11日「障害が収束いたしました」(報告書付き)
http://support.sakura.ad.jp/mainte/mainteentry.php?id=22606 [sakura.ad.jp]
10月12日「障害が発生しております」
http://support.sakura.ad.jp/mainte/mainteentry.php?id=22776 [sakura.ad.jp]