多くの自治体が利用する日本電子計算のクラウド障害、バックアップに問題があり15%は復旧不可に 102
ストーリー by hylom
クラウドでもローカルバックアップは必須なのか 部門より
クラウドでもローカルバックアップは必須なのか 部門より
12月4日、NTTデータ傘下の日本電子計算が運営・提供しているクラウドサービス「Jip-Base」で障害が発生した。これによって複数の自治体のシステムに影響が及んでいるが、同社が12月16日に記者会見を行い、障害の詳細を説明した(日経xTECH、ITmedia、INTERNET Watch)。
すでにストレージ関連の不具合が発生していたことは明らかにされているが、バックアップ機能にも不具合が発生しており、これによって全データのうち15%は単独での復旧が不可能な状況になっているという。ただ、一部は自治体が独自にバックアップを作成している可能性があるようだ。
問題のストレージについてはEMCジャパンと保守契約を結んでおり、障害が発生した4日にEMCジャパンとともに調査を行ったという。その結果、5日にはストレージのファームウェアに問題があることが判明、ファームウェアのアップデートを実施したものの、論理的なデータ不整合が発生していたためにそれだけでは復旧できないことが分かったという。
日本電子計算はファームウェアの検証などは行っておらず、ベンダー側からの情報提供に頼っていたようだ。また、EMCジャパンはファームウェアの不具合について知っていたものの、日本電子計算側にはそれが伝えられていらず、さらにEMCジャパンはこの不具合が重要なものだとは認識していなかったという。
また、バックアップについてはソフトウェアのトラブルで一部が適切に行われていなかったとのことで、これは日本電子計算側に問題があったようだ。
関連 (スコア:4, 興味深い)
関連
15%データ喪失の自治体システム障害、長期化招いた日本電子計算の誤算とミス
https://tech.nikkeibp.co.jp/atcl/nxt/column/18/00001/03389/ [nikkeibp.co.jp]
「動かないコンピュータ」緊急版、自治体クラウド大規模障害の深層
https://tech.nikkeibp.co.jp/atcl/nxt/mag/nc/18/020600011/121600046/ [nikkeibp.co.jp]
関連するか不明
Dell EMC Unity: Fast Cacheのover-provisioning がエラーを引き起こす(ユーザー修正可能)+ FAQ
https://dell.to/2YXbsAH [dell.to]
Re:関連 (スコア:2)
>文字数もスペース込みで14文字で済む
パソコン通信の時代を思い出すなあ、文字数気にしてコメント。
# キーワードは「容量の無駄使い」
実情 (スコア:2, 興味深い)
バックアップ業界のものです
客先の運用をみているとバックアップ評価をしていても
リストア評価をしていないケースが少なくありません
あんたら何のためにバックアップしてるの?
Re:実情 (スコア:1)
バックアップ活用テクニックが必要ですね!
Re:実情 (スコア:2, 参考になる)
今までの経験からすると、
ってところだと思います。
んで実際に障害が発生して慌てて業者に確認するも、プロジェクトは解散済みで担当者もおらず右往左往、
ってのがよくあるパターンです。
Re:実情 (スコア:2, 興味深い)
リストアの継続テストが運用に含まれていないのは、率直に言って技術レベルの低さを体現していると思います。
できてないのとできないのは同じ結果にしかなりませんから。
そのレベルだと敢えてリストアを定義するのはもうやめて、
定期的に主要データのテキストダンプを出させておいて、
データ障害時はシステム停止、人力と努力でがんばりますの方が、
システム復旧計画としては適切かもしれません。
Re:実情 (スコア:1)
何がアレって、リストアテストの実施するには戻すための空き容量が必要なんだけど
それが用意できないので、せっかく組んだ本番環境を一度削除してリストアする、というあたり
そして、それらにだいぶ時間がかかるのに、リストアテストのために使えない時間が長くなることを許容しない
バックアップもアウトか... (スコア:1)
15%どうすんのこれ?
該当自治体では徴税できないとか(いいなそれ)?
復旧したとか言ってる自治体でも、今後税金取られすぎてないかチェックしたほうが良さそう。
Re: (スコア:0)
恐ろしいよなあ。紙でも残ってないデータはどうなっちゃうんだ。AWSやAzure・・・でも怖い。
Re:バックアップもアウトか... (スコア:1)
DropBox [it.srad.jp]を使えば問題なかったのに。
Re: (スコア:0)
バックアップは公文書じゃないから無問題
Re: (スコア:0)
バックアップから戻せば、あるいはバックアップをメインとすれば、公文書になる。
Re: (スコア:0)
官邸へのでっかい忖度に違いない!
(冗談にならんよな)
Re: (スコア:0)
まあお役所のデータってのは無くなってもどうにでもなるもんだよ。
多少の不正の横行は覚悟の上で、大ナタ振るって強引に事を収めるやり方が通じる世界だから。
私企業なら詰まされるところ、公権力はルール変更もやってのける。
これだからクラウドはだめだ!! (スコア:1)
とSIerが叫びそう。
そしてオンプレ回帰へ。
Re: (スコア:0)
あれ? 廃棄HDD転売の方で逆のこと言ってませんでした?
みたいな
Re: (スコア:0)
脱ITの流れですねここは。
Re:これだからクラウドはだめだ!! (スコア:2)
ハンコ屋(のバックにいる政治屋)「ワシの天下がやってくる」
Re:これだからクラウドはだめだ!! (スコア:2)
最近のUSBドングル見てると、ハンコサイズに1TByteくらいなら可能。
Re:これだからクラウドはだめだ!! (スコア:1)
成績通知表 (スコア:1)
練馬区の小・中学に通う子どもを持ってます。
今回問題になったシステムで、いずれの学校も成績通知表の管理をやっていたらしく、今年の冬休み前の通知表は、小学校の方は来年に、中学の方は通知表は不正確(!)な物がもらえ、年明け復旧後に正確(?)な成績表を返す予定とのこと。
ローカルに持っている成績情報は不正確らしい…
Re:成績通知表 (スコア:1)
ローカルにあるのはバックアップだから、公文書じゃないんでしょう。
# お国の見解。
Re:成績通知表 (スコア:1)
>ローカルに持っている成績情報は不正確らしい…
なんでやろ?
改ざんされている可能性があるからなのかな。
中学生不正アクセス成績改ざんか
https://www3.nhk.or.jp/shutoken-news/20191218/1000041616.html [nhk.or.jp]
15%は日本計算機単独での復旧不能なだけ (スコア:1)
で、IaaSなんだから、データバックアップの責任は利用者じゃないかと。
ついでにいうと85%もIaaSとしての復旧であって、システムの完全復旧とは言ってない。
俺が住んでいる自治体はまだ完全復旧してないし。
Re: (スコア:0)
たぶん偉い人もここにいる人も「クラウド=自動でバックアップが取れてる夢の国」みたいなお花畑に生きてたのに、君のコメントが全部焼き払ってくれたみたいだ。
すごくいい気分だ。胸がスッとする。
バックアップは? (スコア:0)
メインフレーム上で複数の自治体のシステム動かしてた時代だと、定期的なフルバックアップと
日次で差分取って、ハードも本番機と待機系を持ってることが多かったような気がする。
今回データが消えちゃったのって、単純にデータのバックアップ取ってなかったんだろうか。
環境用意してバックアップ戻してって、出来ない事情があるとか?
そもそもバックアップ取ってないとか?
バックアップ取ってたけど、同じハード構成でバックアップも同様にデータが消えちゃったとか?
Re: (スコア:0)
Internet Watchの記事読めば大体察せるだろ
富士通とかNTTクラスの金は出せないが実績のある外資はダメで
それでも国産でクラウドって選んだ所が杜撰管理だったんじゃないの
Re: (スコア:0)
ソフトウェアのトラブルって書いてあるだろ。お前みたいな報告やお知らせをちゃんと読まないやつが事故起こすんだよ。
Re: (スコア:0)
団栗の背比べ
Re: (スコア:0)
>論理的なデータ不整合が発生していたために・・
とあるしHDD上で既にファイルシステムが壊れていたとすれば、壊れたものを
バックアップ・リストアしても壊れたものが再現されるだけ。
PCのメモリ化けでコピーしただけのファイルが次々壊れるとかありましたよ私
Re: (スコア:0)
いつから壊れてたんだよ。よく今まで障害にならなかったな。
大体バックアップなんてものはリストアしてみるまでわかんないんだよ。
おれなんか先輩に「これちゃんと戻るんですか?」って聞いたら「さぁ?」って言われたぞ。
普通はテストするだろ!って、もし設定ミスってたら、1ヵ月かけて構築したシステムがパァだぞパァ。
責任取れんのか?
どうせリストアが必要になる可能性なんて皆無なんだから、ばっちりです!って自信満々で言っとけ。
ってまぁこんな感じで、設定ミスってたパターンだろ。ほんと責任感じますわ。ごめんね。
Re: (スコア:0)
https://internet.watch.impress.co.jp/docs/news/1224846.html [impress.co.jp]
> 夕方にはファームウェアップデートとEMC側エンジニアによるスクリプト処理でLUNのオンライン化を進めた。
> 検証環境がなく、重要と思しき情報だけをDellから受け取る体制になっていると回答。
>「FCの一般的なコマンドで運用しているので(サーバーベンダーが異なっていても)問題ない」と回答。
> OSイメージを含むバックアップが何らかのソフトウェア上のトラブルで一部行われておらず復旧が大幅に遅れている。「監視システムに問題があった」(神尾氏)とのことで、
クラウドというか一日中棚に晒してあるサーバをバイキング形式で食べられるだけみたいな印象だな
Re:バックアップは? (スコア:3)
ストレージがUnityだから、Unisphereを監視システム(のひとつ)と呼んでるんじゃないですかね。
データ保護の設定もUnisphereの機能の範疇(しかしバックアップまでは統合してくれないんだなあ)みたいですから、レプリケーションを剥がして固定してからAvamarなりをトリガして、バックアップ取り終わったらレプリケーションをつなぎ直すとかをスクリプトでまとめようとしてちゃんと動かないパターンがあったとかだったりして。
Samsung製SSD (スコア:0)
EMCのSSDは一部Samsung製 [dell.com]で、例のHPEの欠陥SSDもSamsung製 [it.srad.jp]。
日本電子計算は「関係ない」っていっていたけど、ホントかな?
Re:Samsung製SSD (スコア:1)
https://pc.watch.impress.co.jp/docs/column/semicon/1168315.html [impress.co.jp]
ここにあるように、Samsungが業界の1/3のシェアがある圧倒的首位なので。
何かトラブルがあったとき、そこでSamsung製のSSDが見つかる可能性は高い。
情報漏洩起こした企業でIntelのCPUが見つかったり、MicrosoftのOSが使われてることが多いのと同様。
Re:Samsung製SSD (スコア:1)
ストレージのファームウェアに問題があることが判明してるんじゃなかったっけ。
Re: (スコア:0)
hpeの不具合とは関係ない [nikkeibp.co.jp]って言ってるんだからそりゃ関係ないだろ、使ってるシステムはhpeじゃなくてDELL|EMCなんだから。
Samsungってとこに過剰に引っかかる人がいるけど、hpeはOEM品のファームをメーカー問わず専用品レベルまで
ゴリゴリカスタムするので、hpeのチョンボじゃねーの?って思ってる人は多いと思うよ。他社は沈黙のママだし。
hpe保守流れのSSDってOEM元に関わらずSMARTがまともに取れなくて困るんだよなー、Intelとか安いんだけどね。
Re:Samsung製SSD (スコア:4, おもしろおかしい)
> 沈黙のママ
新シリーズでセガールの母ちゃんが出てくるのかと。
Re:Samsung製SSD (スコア:2)
見た目は無敵オヤジだけど、心は女でお母さんなのよ。
Re:Samsung製SSD (スコア:1)
弾はもう切れてしまったが慌てることはない。俺には不要になった玉があるから武器に使おう。
Re:Samsung製SSD (スコア:1)
沈黙の肝っ玉母さん
Re:Samsung製SSD (スコア:1)
Re: (スコア:0)
Samsungが原因だったら嬉々として責任転嫁するわなw
被害あった自治体の一覧ないの? (スコア:0)
知りたいな
Re: (スコア:0)
本家発表:https://www.jip.co.jp/news/pdf/20191214.pdf
本家発表はすぐ更新される(消される?)ようで初期の頃のまとめは
https://piyolog.hatenadiary.jp/entry/2019/12/11/063826 [hatenadiary.jp]
犯人 (スコア:0)
これは今学期成績の悪かった小中学生クラッカーの仕業
小中学校の通知表発行できず 練馬区システム障害の影響
https://headlines.yahoo.co.jp/hl?a=20191216-00000048-asahi-soci [yahoo.co.jp]
オフラインバックアップは? (スコア:0)
普通基幹システムみたいなのは、週次くらいでオフラインバックアップとるもんだとおもってたけどどうなの?
・オフラインバックアップをとってなかった
・オフラインバックアップはとってたが一部取り忘れてた
Re:オフラインバックアップは? (スコア:1)
↑これ、ちゃんと読んだ?
Re:オフラインバックアップは? (スコア:1)
オフラインというと、「別の筐体」にコピる事で
それは初めて聞く定義ですが、どの辺りで使われている定義ですか?
普通、オンライン・オフラインと言うのは、サービス中/稼働中か否かで区別すると思います。
同一筐体でのバックアップだと、今回の様なケースを救えない場合があるのはご指摘の通りですが。
データが消えて (スコア:0)
税金が減ってくれたらありがたい。
まあ年に¥500万も払ってない人には関係ないだろうけど