パスワードを忘れた? アカウント作成
13931530 story
バグ

大阪市でシステム障害、ほぼすべての証明書が発行できない状態に 21

ストーリー by hylom
お疲れ様です 部門より

6月7日に大阪市のシステムで障害が発生、住民票や保険年金関係、介護保険関係などさまざまな業務で書面や証書の発行ができない状況になっていたという(大阪市の発表)。復旧作業は8日に完了し、10日より通常業体制に戻っているようだ(大阪市の続報日経新聞)。

システム停止の原因は調査中とのことだが、データベースを管理するファイルに不具合があったことが報じられている。

  • by junichi308 (15687) on 2019年06月11日 15時29分 (#3631453)

    「データベースを管理するファイル」って
    なんの事だろう?

    ここに返信
    • Re:えーと (スコア:5, 参考になる)

      by Anonymous Coward on 2019年06月11日 15時46分 (#3631459)

      システムファイルだそうです。

      [独自記事]大阪市システム障害で新事実、破損したDBMSはOracle RAC
      https://tech.nikkeibp.co.jp/atcl/nxt/news/18/05221/ [nikkeibp.co.jp]

      • by junichi308 (15687) on 2019年06月11日 16時12分 (#3631470)

        情報ありがとうございます。

        偶然同時に同じファイルが壊れるとは思えないから、原因突き止めないと不安だなぁ
        「壊れるメカニズム」が存在してそう。

        • by Anonymous Coward on 2019年06月11日 17時45分 (#3631559)

          システムファイル壊れてシステム機能不全になるならRACの値打ちないなー。
          両ノード同時にファイルが壊れて機能不全というのはわかるけどRACの値打ちないなー。
          RACの仕組みなのかファイルシステムのせいなのかは記事からはわからないですけど。
          #1x年以上前にRAC構築したりしてました。

          • by Anonymous Coward

            確かに酷いですね。これじゃRACの意味ないじゃん。

        • by miishika (12648) on 2019年06月12日 6時31分 (#3631871) 日記
          制御ファイルかサーバーパラメーターファイルなら、共有ディスクに置かれるので
          全部が同時に壊れることも十分考えられそう。
          • by Anonymous Coward

            RACですからデータベース本体も共有ディスク内にあるはずですよ。

            > データベースを格納するストレージは共有となっており、2ノードのサーバーのいずれからもアクセスを受け付ける構造
            とも書かれています。

            ちなみにRACは両アクティブの冗長性のメリットを打ち消すくらいトラブルが多いです。
            アクティブ=スタンバイ構成のほうが精神的にもずっとマシです。

            • by Anonymous Coward

              >ちなみにRACは両アクティブの冗長性のメリットを打ち消すくらいトラブルが多いです。
              プラットフォームに依るんですけどね。きちんと組めばちゃんとRACの本領を発揮できる構成もありました。(過去形)

              が、今となっては
              >アクティブ=スタンバイ構成のほうが精神的にもずっとマシです。
              仮想化技術とか諸々RACじゃなくてもよい構成で組めますね。
              どの程度の可用性を求めるか次第ですけど。

            • by Anonymous Coward

              RACだと二台同時稼働だけどアクティブ=スタンバイ構成だと一台は待機してるわけでもったいないとかなんとか。

              一台に縮退した時点でさばける量が半減するわけだから構成するの難しそうだなとか、そもそも額面通り動かないとか色々あるんでしょうけど。
              幸か不幸か実運用ではやったことないな。まぁ客が金ないだけなんだけど。

      • by Anonymous Coward

        もしやSolaris & zfsか?

      • by Anonymous Coward

        「システムファイル」ってなんの事だろう?

  • by Anonymous Coward on 2019年06月11日 14時53分 (#3631438)

    知りたいのはそこじゃない。どこがやらかしたかだ!

    ここに返信
    • by Anonymous Coward on 2019年06月11日 15時49分 (#3631461)

      > どこが~? 
      もちろん、大阪市がやらかした。 
      って揚げ足取りはおいといて、

      今回の障害との関連性は不明だが、委託先をググると
      「基幹系システム統合基盤(別名:統合基盤システム)」の業務委託を受けているのはNTTデータ関西、
      「住民基本台帳事務システム」もNTTデータ関西。
      それと、この資料 [osaka.lg.jp]を見ると、
      統合基盤システムのリース機器の保守には、日立キャピタルも関わっている。
      もちろん、あくまで主な業者・元請けとしてであるし、数あるソフトによる競合とかも考えられるから、何が引き金になったかは、続報を待つしかない。

      なお、「大阪市統合基盤システム」でググると、サジェスチョンに「oracle」というキーワードが出てくるのは、はて、何ででしょう?

    • by Anonymous Coward

      NTTデータ関西だよ。

  • by Anonymous Coward on 2019年06月11日 17時56分 (#3631570)

    夜間、手元のOracleSEではそのパラメータは再起動するまで有効にはならなかったから…なんて程度の検証で、誰かが作ったボタン一発で両ノードのpfileを書き換えてくれる便利なツールで気になるパラメータをちょこっと書き換えたが、設定値が間違っていた上にその間違えているパラメータが即座に有効になってしまい、サーバがダウン、と。

    で、pfileを見てみると仕様書通りでない値になっており、
    ベンダ「pfileが不正な状態である」
    大阪市「pfileって何だ?」
    ベンダ「データベースを管理するファイルである」
    なんた会話があり、大阪市は「データベースを管理するファイルに不具合があった」と報告。

    夜中にやらかした保守の派遣社員は携帯スマホの電源切って北海道へ逃避行中。

    ここに返信
    • by Anonymous Coward on 2019年06月11日 18時30分 (#3631599)
      詳しいな。本人? ウニ食べた?
    • by Anonymous Coward

      pfileって修復に20時間もかかるん??

      • by Anonymous Coward

        本当に仕様書通りではないって状態であれば、「何が正しいの?」ということにもなり、過去の経緯や作業履歴をひっくり返す必要もあるので、20時間ですめばマシなのではないか。

        • by Anonymous Coward

          一旦変更前に戻すだけだろ。
          20時間もかかるかよ。
          やりたかった変更を適用するのはそのあとだ。

typodupeerror

最初のバージョンは常に打ち捨てられる。

読み込み中...