Skylake CPUで複雑な処理を実行させるとPCがフリーズするバグが確認される 51
ストーリー by hylom
なにがトリガーか 部門より
なにがトリガーか 部門より
Intelが昨年発売した第6世代Intel Coreプロセッサ(コードネーム「Skylake」)で、複雑な処理を実行させるとPCがフリーズするという問題が発覚した。マザーボードのファームウェア更新で対応できるという(Ars Technica)。
記事によると、素数探索ソフトウェアであり、CPUの負荷テストツールとしても使われる「Prime 95」の実行時にこの問題が発生することが確認されたという。Intelはこの問題を修正するプログラムを開発中で、ハードウェアのファームウェア更新で対処できるようになる模様。
この問題が発生する理由は不明だが、WindowsおよびLinuxの両方で発生するという。また、Prime 95以外のソフトウェアでも問題が発生する可能性があるという。
要更新 (スコア:1, おもしろおかしい)
オレの頭も最近複雑な処理させるとフリーズじゃなくスリープしてしまうんだけど、
更新ファームウェアある?
Re:要更新 (スコア:2, おもしろおかしい)
あるけど一度電源を切らないと
Re: (スコア:0)
ロードデフォルトくらいでなんとかなりませんか
Re:要更新 (スコア:1)
ウオッチドッグタイマを追加しましょう。
一定時間反応がなければ割り込み信号が来ますからスリープする暇がなくなるでしょう。
notice : I ignore an anonymous contribution.
Re: (スコア:0)
喝っ!
Re: (スコア:0)
いつでも寝られるなんて、むしろとんでもない特技なのでは?
Re: (スコア:0)
年を取ると身につくスキル
Re: (スコア:0)
つ http://srad.jp/story/16/01/14/0627217/ [srad.jp]
ハードウェアのファームウェア (スコア:0)
なにそれ?
マザーボードのファームウェア ってのもなぞ。いわゆるBIOSのこと?
Re:ハードウェアのファームウェア (スコア:5, 参考になる)
マイクロコード [wikipedia.org]のことですね。
20年ほど前、Intel の Pentium に浮動小数点演算が特定の条件下で計算を誤るというバグ [wikipedia.org]がでてリコール沙汰になり、
そういう事態への対策として、Pentium Pro 以降は、マイクロコードの書き換えによる命令実行動作の修正ができるようになっています。
書き換えたマイクロコードを保持する不揮発メモリなんかはCPU上に無いので、
マザーボード上のBIOSなどにマイクロコード更新プログラムを取り込んでもらい、
電源投入時に毎回更新する、という流れになります。
Re:ハードウェアのファームウェア (スコア:4, 参考になる)
WikipediaのFDIV バグのページに有るように、OSが対応することも有る。
エラッタが生じた場合にはBIOSやOSのアップデータを介してこれを回避するマイクロコードを提供する。
Windowsでの例(上記のバグでは無い)
https://support.microsoft.com/kb/3064209 [microsoft.com]
https://support.microsoft.com/kb/2970215 [microsoft.com]
https://support.microsoft.com/kb/936357 [microsoft.com]
軽く検索してみた限りでは、Linuxも対応できる仕組みが有るようだ。
Macは情報が見つからなかったけれど、有ってもおかしくないとは思う。
# Microsoftの機械翻訳が重いうえに酷い。キヅタの町って何だ…
Re:ハードウェアのファームウェア (スコア:5, 参考になる)
Linuxの場合、ディストリビューションによっても異なりますが、
周辺機器のファームウェアと同様にマイクロコードを/lib/firmware以下に置いて対応します。
ucode-intelのようなパッケージ名で提供され、ブートローダの段階で読み込むか、
起動プロセス内でmicrocode_ctlというコマンドを実行して読み込みます。
翻訳 (スコア:2)
なんぞと思って調べてみたらアイビー(Ivy)を植物の木蔦(キヅタ)と訳しているみたいですね。
最初"Ivy Town","Ivy Bridge"とスペースが入っているせいで固有名詞判定から漏れているのかと思いましたが、
intelの文書を見る限り、スペースありが正しいみたい。
Re: (スコア:0)
宇宙天啓データベースのれきし (スコア:0)
宇宙天啓データベース
↓
Cosmos Revelation Database [fukatani.org] 単語登録されたらしい
↓
神秘が明らかになりますデータベース [yahoo.co.jp] ←なぜかせっかく登録した単語をわざわざ削除したようだ
↓
Cosmos Revelation Database [microsoft.com] 機械翻訳が提供されな
Re: (スコア:0)
ドイツ語だとやばいけど、英語なら頭文字が大文字であることから固有名詞推定とかできないのかなあ。
Re:ハードウェアのファームウェア (スコア:1)
microcode_ctlパッケージで使用できるmicrocode.datが早く公開されるといいね。
Windows? 知らんがなあ
Re: (スコア:0)
Windowsはmcupdate_GenuineIntel.dllが内部に抱え込んでいるので、Windows Update待ちですね。
Re: (スコア:0)
未だに色んなコンパイラのオプションに残ってるもんね。
・多層防御の重要性
・ハードも訂正の仕組みは必要
この二つはホント大事だと思う。
Re: (スコア:0)
Pentium Pro 以降は、マイクロコードの書き換えによる命令実行動作の修正ができるようになっています。
Intel Quark Core には LOCK プリフィクス付の命令に不具合があり [kei-sakaki.jp]、インテルの決定としてそれに対して対策を行わない [kei-sakaki.jp]ってのは、Quark Core が基本旧い486を元にしたデザインでマイクロコードの修正が行えない、とかってことかねェ。
Re:ハードウェアのファームウェア (スコア:2, 参考になる)
マイクロコードだろうね
BIOSでCPUにロードしてlockdownしてOS起動みたいな
Prime 95でフリーズ (スコア:0)
今まではOC→Prime 95→フリーズ
このクロックまでのOCは無理か……になってたんだろうかな
SkylakeはOC周りの制限が緩かったというか以前に戻っていた感があっただけに、これでついでに修正されないことを願う
Re:Prime 95でフリーズ (スコア:3, 興味深い)
Haswell買ったときに、OCしたことないのにPrime95で落ちる症状があって、WindbgのエラーダンプではL2キャッシュのエラーが出ていたので交換してもらったら発生しなくなりました。
2chでOCしてないのに似たような症状を訴えている人がいたので、ダンプの手順を教えてあげたら同じエラーだったので、交換を勧めたらその後交換で直ったという報告がありました。
最近のはクロックに応じて電圧も頻繁に変化させているので、検証の不十分なパスがあると何かの拍子に問題が出てしまうというのはありそう。
Re: (スコア:0)
今まではOC→Prime 95→フリーズ
このクロックまでのOCは無理か……になってたんだろうかな
OCしなくてもフリーズすんなら馬鹿の早合点だろ。
この問題が発生する理由は不明? (スコア:0)
「Skylake CPUで複雑な処理を実行させると~」ってタイトルと矛盾してね?
つーか「複雑な処理」って何言いたいのかワケわからんけどな、タレコミ者がアホなのだろう。
Re: (スコア:0)
hylom「休日は調子が出ない」
Re: (スコア:0)
複雑な文章を編集させると誤字が出るバグが確認されています。
Re: (スコア:0)
元記事のタイトルが理解できないアホもいるんだな。
Intel Skylake bug causes PCs to freeze during complex workloads
Re: (スコア:0)
complex workloads が原因なら Prime 95 に限らずフリーズしまくりな気がするが?
Re: (スコア:0)
著名ベンチマークアプリはこういうことがあるから
検証に取り入れるもんだと思っていたが
VW (スコア:0)
Prime 95のプロセスで動いていることを検知したら本気だす必要があるからな
Re: (スコア:0)
とりあえずPrime95でのフリーズの再現性が確認された。原因はまだ不明。
(あるいはIntelは掴んでるかも知れないけど、一般には公開されていない。公開すると悪用されて危険なのは自明)
簡単な処理で凍るんだったら、もっと早くに問題が顕在化したに違いないから、
Prime95にしかないような何か複雑な処理が原因なのだろうと推測される。
という風に読み取れないほどのアホが存在するとは思わなかっただけだろ?
Re:この問題が発生する理由は不明? (スコア:4, 参考になる)
ドイツのPCエンスー向け掲示板で発見されて、Prime95界隈で再現手法が確立された。
公開されているのは、Prime95でAVXとHTを使って特定のパラメータを指定してスレッド数をCPUの上限である8スレッドでしばらく回すと固まるということ。
これに対してIntelは既に新しいマイクロコードを書いたので配るべく努力していると言ってる。
Quarkみたいにどうopcodeを並べると死ぬかは公開されてない。公式のエラッタもまだ出てない、と思う。
Re:この問題が発生する理由は不明? (スコア:3, 興味深い)
趣味で、AVX を使った OTFFT という FFT ライブラリを開発してるんですが、
Haswell や Ivy bridge では問題ないのに Skylake だと
系列長が 2^18 以上になると急激な性能劣化を起こします。
クロックの低い Haswell に敵わなくなるんですよ。
もちろん、Core i7 でのベンチマークなので HT も使ってます。
キャッシュのアルゴリズムが変わったせいかと思ってたんですが、
何か、このフリーズのバグと関係あるかもしれない。
ちなみに、FFTW でも同様の現象が観測できます。
Re:この問題が発生する理由は不明? (スコア:1)
つまりSkylakeでもAVX非対応のPentium/Celeronはセーフ、HT非対応のCore i5もセーフとみていいのかな。
一瞬、i7の対策版が出るまで買い控えようか迷ったけど、Haswellでもエラッタが出てたので複雑なものとしてバグは避けがたいのかも。結局欲しい時が買いどきか。
14nmはハイパフォーマンスプロセスの開発が放棄されたらしい (スコア:1)
大原考察ではそういうことらしいので、クロックを上げるとある程度から指数的に熱が増える
で、そうなっても性能が伸びないのを防ぐためにデコーダを豪華にしてパイプラインを伸ばした
で、最近のCPUは熱暴走しないよう温度を見てクロックを落とす動作をするんだけど、
FIVRのオミットで制御粒度が荒くなった。にもかかわらず熱制御は5xxxシリーズレベルでピーキーになっていて
周波数を落とすのが間に合わないか、とある重たいopコードが優先されて落とせないか、そんな感じでしょう。
高速プロセスなら問題なかったかもしれない組み合わせがSoCプロセスではダメだったと。
バリデーションの見落としですかね。
microcodeで温度制御を優先すればフルロードでも落ちないでしょうし、HTでカリカリに使わない
下位モデルでは多分落ちない。
温度制御を無効にするようなopcodeのせいだと下位でも落ちる可能性がありますけど、i7でしか確認されてないので
Tjunctionからの周波数降下が間に合ってないんでしょうか。
Re:14nmはハイパフォーマンスプロセスの開発が放棄されたらしい (スコア:2)
スレッド数と与えるパラメータも決まっていることが熱暴走説だと説明できないような……?
Re: (スコア:0)
じゃあ外から液体窒素でも何でも使ってガンガンに冷やせばフリーズしなくなる、或いはフリーズする可能性が下がるってことかなあ? やろうと思えば可能な検証方法だと思うが。
Re: (スコア:0)
大原考察ではそういうことらしいので、
大原って雄介? およそ技術的なことはなんも分かってないライターの名前は出すべきではないかと。
Re: (スコア:0)
じゃあSkylakeはクロック落とせばPrime95でフリーズしなくなんの??
Re:デッドロックでしょ (スコア:0)
マルチスレッドでフリーズといえばデッドロック。
この問題にぶち当たると、なぜ、どういうタイミングで起きるのか、全くわからないことが多い。
Re: (スコア:0)
特定のコードシーケンスで発生するならスレッド数を最大にしなくても発生しそうなものだし、リソースの競合なら「しばらく」実行しなくても発生しそうな気が。
CMOSは高温になると動作条件が厳しくなるので、CPUをフルに使うのも「複雑な処理」と言えるでしょうね。
Prime95って設定した上限温度に達するとベンチを停止する機能があって、グリスのCPUでAVXやHT有効だとどんどん温度が上がっていきました。
Prime95はそこらのベンチよりも相当負荷が高そうなベンチなので…
Re: (スコア:0)
特定のコードシーケンスで発生するならスレッド数を最大にしなくても発生しそうなものだし、リソースの競合なら「しばらく」実行しなくても発生しそうな気が。
複数のコアから利用されるリソースのシェアに完全でないところがあり確率的に不具合が発生するとかが原因なら「スレッド数最大」&「「しばらく」実行」でフリーズするというのもあることだと思うよ。
Re: (スコア:0)
「Skylake CPUで複雑な処理を実行させるとPCがフリーズする」ってのは症状だろう。
具体的にどこにバグがあってどういう仕組みでフリーズが起きるのかというのが理由、あるいは原因。
お医者様に行って「数日前から、ちょっと走っただけで動悸がすごいんです」というとき、
「走る」というのは「動悸」の原因じゃない。「走ると動悸がする」という文全体で症状。
それに対してお医者様が検査をして「心臓に不整脈がみられますね」と告げる。それが原因。
Re:この問題が発生する理由は不明? (スコア:1)
mera.red/おそロシア・・・
Re: (スコア:0)
「Skylake CPUで複雑な処理を実行させるとPCがフリーズする」ってのは症状だろう。
Skylake CPUでPrime95を実行するとフリーズするってのが症状。「複雑な処理」かは不明。特定の命令を特定の条件で実行するだけでフリーズしてる可能性も考えられる。
Re: (スコア:0)
複雑な処理のうちどの組み合わせで発生するのかという根本的な原因の切り分けはまだなんでしょうよ。
Re: (スコア:0)
複雑な処理のうち
それすら未確定じゃね?
名前が悪い (スコア:0)
やっぱりビルディじゃないと