
フラッシュメモリの消耗によってエラーが頻発している火星探査機Opportunity、遠隔からの再フォーマット実施へ 57
ストーリー by hylom
宇宙を越えた再フォーマット 部門より
宇宙を越えた再フォーマット 部門より
headless 曰く、
NASAの火星探査機Opportunityは10年以上にわたって火星の探査を続けているが、最近システムの再起動が頻発するようになっているという。NASAでは同機に搭載されたフラッシュメモリーの消耗が原因となっている可能性があるとして、再フォーマットを計画しているそうだ(プレスリリース、The Regisiter、Slashdot)。
Opportunityのコンピューターシステムには放射線耐性を高めたIBM RAD6000プロセッサ(20MHz)と256MBのフラッシュメモリが搭載されている。フラッシュメモリは繰り返し上書きされているため一部のセルが消耗しており、これが再起動の原因となっている可能性が高いという。再起動は1~2日で完了するものの、8月には10回以上の再起動が発生して探査活動に影響が出ている。
再フォーマットでは、フラッシュメモリで不具合の出ているセクタを特定し、それらを使わないように設定する処理を行うとのこと。再フォーマットに先立ってフラッシュメモリ内に残っている有用なデータをすべて地球にダウンロードし、フラッシュメモリを使用しない動作モードに探査機を切り替える。
また、準備中に再起動した場合に復旧しやすいよう、通信速度も低下させるという。重要な処理を行うプログラムは別の場所に保存されており、5年前にはSpiritでも再フォーマットを実行しているため、トラブルが発生する可能性は低いとのことだ。再フォーマットは今月上旬に実行される。
忘れっぽい (スコア:2, すばらしい洞察)
おいらの頭もフォーマットしなおしたら、まともになるかな?
Re:忘れっぽい (スコア:3, おもしろおかしい)
「ちなみにこれで三回目ですよ」
Re:忘れっぽい (スコア:1)
Re:忘れっぽい (スコア:2)
Re:忘れっぽい (スコア:2)
すみません
どうしてもだめなんです
# SSDだけに
Re: (スコア:0)
「済みません」なら大丈夫だけど「吸いません」ならフォーマットが必要だね
Re: (スコア:0)
バッテリーバックアップの電池、消耗してませんか?
製造年度を考えると、多分SRAMでしょうから。
Re: (スコア:0)
さっきフォーマットしたばかりでしょ。
Re: (スコア:0)
フォーマットするとフォーマットしたこと自体わすれてしまいますので・・・
Re: (スコア:0)
つ y=ー
Re: (スコア:0)
それにはまず、あなたの頭の不具合箇所を調べてから……
先を見据えて次世代不揮発メモリーの放射線耐性 (スコア:1)
どうなんでしょうか
PRAMは強うそうな感じですが、STT-MRAMは弱そう
そんな実験できるほど実用化進んでないんでしょうけど
Re: (スコア:0)
次世代ディスプレイ素子が液晶にことごとく敗退したのと同じような展開にならなきゃいいんですがね。
Re: (スコア:0)
少なくともMRAMの方が現行の半導体メモリよりずっと宇宙での利用では有利とされてますね
#本日まで慶應義塾に日本磁気学会で通ってたのでAC
リブートするってことは (スコア:0)
データだけじゃなくて、システムソフトウェアがフラッシュ上にあるって事なのか。
それは強い放射線に晒される探査機の設計としてどうなの?
それとも探査機が目的地についてからも、リモートでソフトウェアの書き換えをする必要があったりして、致し方ないのか?
Re:リブートするってことは (スコア:3, すばらしい洞察)
想定稼働時間の10倍以上動いてるのに「設計としてどうなの?」とか言われちゃうんだなあ…
Opportunityさんすげえ Re:リブートするってことは (スコア:2, 興味深い)
ここにぶらさげとこう・・。
何年か前に、コズミックフロントという番組でOpportunityさんについての回があった。
想定稼働時間は(たしか)半年の設計にも関わらず、その時点で7年超えて稼動しているという内容を聞いて
なんともいえない感動を覚えた。
そして今回、まだ現役稼働中で、問題が発生したものの遠隔による修正も高い確率で成功しそうと聞いて感慨にふけっていた。
にもかかわらず、この流れ・・・。
悲しい、悲しすぎるわ、あんたら・・。
Re:Opportunityさんすげえ Re:リブートするってことは (スコア:2, すばらしい洞察)
俺も確信した。
日本はロボット労働者に対しても確実にブラック労働環境をおしつけるであろうと!
Re: (スコア:0)
そしてスカイネットが「人間さん嫌い!消えちゃえ!!」
Re: (スコア:0)
意外と放射線が飛来してないのかな。
Re: (スコア:0)
10年以上も稼働しちゃう原子力電池。
一般用途にも使えないかなぁ…。
Re: (スコア:0)
原子力電池は後輩のCuriosityでOpportunityは太陽電池とバッテリ駆動だったはず
Re:リブートするってことは (スコア:1)
それとも探査機が目的地についてからも、リモートでソフトウェアの書き換えをする必要があったりして、致し方ないのか?
打ち上げ時の時は、ソフトウェアはまだ開発中なのです。
完成しているわけないじゃん。移動中の時間を使って一生懸命デバッグですよ。
Re: (スコア:0)
摩耗したセルにアクセスすること自体がクラッシュの原因になる、てことでは。
重要なソフトウェア等は別の非揮発メモリ内に保存してあるってことなので、このフラッシュメモリの中身は測定データが主じゃないでしょうか。
Re: (スコア:0)
エラーがある程度以内なら訂正を行い処理続行、あまりにエラーが多かったらセーフモードに移行、って処理にした事あります。
スレ元はエラーを含んだプログラムを実行してクラッシュしてリブート、というPCのような落ち方を想像してるみたいですが、それは無いでしょうね。
エラー訂正が多すぎる→なにか異常な状態だ→意図的にリブート
これが頻繁過ぎるのでフォーマットしてみようという話かと。
コードやクリティカルなデータにはもっと厳重なエラー訂正をかけるでしょう。コードに訂正不可能なエラーが含まれていた場合、実行する前に安全に止めて報告するぐらいの処理は普通にやってるでしょう。
Re: (スコア:0)
昔々、20年程昔、とある 24時間連続で信号解析する専用装置開発の末席を汚してた時の事。
そいつは性能確保のため、データバッファメモリにまだ枯れてない新規設計ハードを採用してたんだが、
ちょくちょく無応答になってくれてね、そうするとシステムバスがタイムアウトして NMI 発生、
そういうハードエラーを想定してなかったので、default のシステム丸ごとリセットが掛かって大変だったです。
# この件については、ハードが改修されるまで、ダミーデータを読んだことにするパッチ当てて凌ぎました。
データメモリであっても故障が検出され、それへの対応が用意されてなければ、装置としては halt するか reboot するかしかないと思います。
Re: (スコア:0)
惑星探査機でハードエラーを想定してないソフトウェアの作りってのはまず無いんでは?
Re:リブートするってことは (スコア:1)
この場合ハードエラーへの対応がリブートです。
んで同じハードエラーでリブートの頻度が増えてきたから、そろそろその箇所を使わないように再フォーマットしようって話です。
うじゃうじゃ
Re: (スコア:0)
耐用年数をとうに過ぎて発生し出すエラーまでは想定しないんぢゃないかな。
Re: (スコア:0)
耐用年数を超えたエラーと普通のエラーは同じエラーですよ。
Re:リブートするってことは (スコア:1)
耐用年数後に出るエラーが年数内のエラーと同じだと
分かるのは年数後の結果論じゃないかな
叩いて直す方法は距離的に難しいので (スコア:0)
とりあえず
再起動
それでもダメなら
フォーマット
# むしろOpportunityを叩きにいくだけの衛星とかつくるってのもアリかもしれない
Re:叩いて直す方法は距離的に難しいので (スコア:1)
Re:叩いて直す方法は距離的に難しいので (スコア:1)
鳩山元首相に連絡を取ってもらって叩いてもらったらどうかな?
Re: (スコア:0)
そのココロは?
Re: (スコア:0)
お仲間の火星人に叩いてもらう。
Re: (スコア:0)
「鳩山 宇宙人」で検索してみては?
Re:叩いて直す方法は距離的に難しいので (スコア:1)
再起動したら音楽が流れるのかな?火星人がおもしろがっていたずらしてたりして。
Re: (スコア:0)
こんなこともあろうかと、トンカチ持ったロボットアームが出てくるとかはないの?
Re:叩いて直す方法は距離的に難しいので (スコア:1)
Re: (スコア:0)
今から一緒に殴りに行こうか
VNC or RDP? (スコア:0)
まともにディスクの管理、操作できるのかなぁ?
Re: (スコア:0)
全く今時の若いもんはtelnetも知らんのかぁ
Re: (スコア:0)
IPなんか通るわけないじゃん。
バッチだよ。
VxWORKSだし。
#とマヂレスしてみる
逆に (スコア:0)
フラッシュメモリが消耗してても、
時間がかかるだけで再起動すれば正常に動くのがすごい。
まあそのぐらいフェイルセーフないと宇宙では使えないんでしょうけど。
ウチらのOSも少々のHDDエラーぐらいで起動不能にならないように・・・(まあ最近はずいぶん頑丈になりましたけどね)
遠隔保守をする勇気 (スコア:0)
最近はクラウドやVPSに移行して、コンソール画面まで遠隔で行けるようになりましたけど、かつてはリモートログインだけのレンタルサーバも多かった。
そんなレンタルサーバをリモートからOSアップデートして再起動するだけでもドキドキでした。
戻ってこなかった…ということも無かったわけではありません。
サーバの前には行けないから、リモートハンドでサービス提供会社に有料でお願いしたり。
それを火星でやっちゃうというのが、勇気あるなと。
ま、当初の活動予定期間を大幅に超えているので、元は取った。失敗して死んだら、それはそれで諦める、ということなのかもしれませんが。
もちろん万全のバックアップの仕組みがあるのでしょうけれど。
Re:遠隔保守をする勇気 (スコア:4, 参考になる)
メンテナンス時のミスで無応答になってしまった例だと、同じ火星探査機でバイキング1号 [wikipedia.org]ってのがあります。
この失敗したメンテナンスというのは、今回の話のオポチュニティと同じく、長期間の運用で劣化した機材に対応するというものでした。しかもこのバイキング1号、無応答になってしまうまでは、オポチュニティによって28年ぶりに記録が塗り替えられるまで、惑星・衛星表面における宇宙探査ミッションの最長運用記録を持っていた [slashdot.jp]という、なかなか因縁深い存在だったりします。
# この手のちょっとした偶然の一致のネタって大好き。
部門名 (スコア:0)
Re: (スコア:0)
海を渡ることを「海を越えて」って言うみたいな感じ
Re:部門名 (スコア:1)
海の場合、中じゃなく上を行くから「越えて」という言葉でいい気がするが、
宇宙だと中を行くからなぁ・・・とか考えてみたけど、
「時を越えて」という言い回しもあるんだよな。
「メビウスの宇宙を越えて」だったら、それこそ宇宙から抜け出す(ことができない)って話だった。