TOP500や「Graph500」など4つのスパコン性能指標で富岳が世界一を達成 151
ストーリー by hylom
久しぶりの一位 部門より
久しぶりの一位 部門より
jizou曰く、
スーパーコンピュータの性能ランキング「TOP500」の2020年6月版で、理化学研究所(理研)の「富岳」が1位となった。また、TOP500だけでなく「HPCG(High Performance Conjugate Gradient)」や「HPL-AI」、「Graph500」といった別の性能評価指標を使ったランキングでも世界1位となっている(マイナビニュース、PC Watch、日経新聞)。
とりあえず2.8倍の性能はめでたいのだけれど、お金が足りずにラック数が増やせず、他の国のスーパーコンピュータにすぐに追い越されてしまうというとのは残念だけれど、まずは、予算の少ない中、TOP500に載った関係者の方々の努力に感謝したい。おめでとうございます!
富岳は富士通が手がけたArmベースの独自CPU「A64FX」を採用しているが(過去記事)、富岳が世界一の性能となったのはこのCPUの力が大きいという。
たまにはGreen500の事も思い出してあげて下さい (スコア:1)
PFNの国産スパコンが消費電力性能で世界一に [impress.co.jp]
Re: (スコア:0)
牧野先生のLINPACK用カリカリチューン技術を使って、ニューラルネット用ってラッピングしたやつでしょ。
もうLINPACK=スパコンの時代じゃないんだから、Top500に出すなら、HPCGも出さないとみっともない。
中国はTianhe, Taihulight と遅くてもHPCG出してたのに。
ニューラルネット専用ならニューラルネット専用のところで競争しないと、チートじゃね?
Re: (スコア:0)
LINPACK/Wだけじゃなく、HPCG/Wや、TEPS/Wも出してほしい
Re: (スコア:0)
HPCG/Wについて、 The Green HPCG List and the Road to Exascale [insidehpc.com]というのがあったんですが、それに対して、PEZY チーフテクノロジエバンジェリスト 坂本亮さん [twitter.com]は全面否定しています。
HPCGって乱暴に言えば演算器は大半の時間寝てるんだから電気食うわけないじゃんみたいなヤツなので、それでGreenとかなんとかいってもまじで意味ないだろ何言ってんだみたいな感じがあって大変よろしいですね
TEPS/WのGreen Graph500 について、ExaScalerの田中英行さん [twitter.com]は否定的です。 [twitter.com]
スパコンランキングのTop500のグラフ版、Graph500のワット当たりパフォーマンスの番付なんだけど、スモールデータカテゴリーのランキングが上位エクスペリアだらけで
Re:たまにはGreen500の事も思い出してあげて下さい (スコア:2)
4位のプロトタイプは2.0GHzの通常モードで走らせてますが、9位の富岳はブーストモードを使って2.2GHzで走らせてますね。周波数が高い分エネルギーを消費するのでしょう。
https://www.fujitsu.com/jp/about/businesspolicy/tech/fugaku/specifications/ [fujitsu.com]
あぁ、「ン」が消えてるんですよ。「ビーフン・カレー」ね。
2020年稼働予定の米国スパコン「Perlmutter」 (スコア:0)
Pre-ExaScaleらしいからこいつが稼働したら抜かれるのかね
さすが (スコア:0)
さすが富岳100京
Re:オレを呼んだか? (スコア:2)
なぜわざわざ独自CPU? (スコア:0)
なぜわざわざ独自CPUを作ったのか?
コンペティタは汎用品として売られてるGPU/CPUでスパコン作れてるのにお金がもったいない
富士通が自前で最先端のfab/プロセスを持ってるというなら話は分かるがそうでは無いだろ
Re:なぜわざわざ独自CPU? (スコア:5, 参考になる)
スパコン一般の話も入っていますがこんなところが普通のCPUから強化されています
・高い演算性能を出すために、浮動小数点演算のベクトル拡張が入っている(4オペランドFMA、プレディケーション付きとのこと)
・メモリレイテンシが大きいところでも高いメモリ帯域が出せるようにハードウェアプリフェッチとか、ベクトル長を大きくしているとか
・複数CPU間で動作を同期するための時間を短縮するハードウェアバリア機構が入っているとか
・故障検出やエラーリカバリ機能を強化して、スパコンとして沢山CPUを並べてもシステムとして成り立つようにしているとか
公式資料はこちら
たぶん、これでも沢山の工夫のうちの少ししか紹介されてない
https://www.fujitsu.com/jp/solutions/business-technology/tc/catalog/ [fujitsu.com]
なんでって思うのは勝手なんだけど、自分がちゃんと知らない事は否定しないで欲しい
Re: (スコア:0)
> スパコン一般の話も入っていますがこんなところが普通のCPUから強化されています
お安くお願いしますよホント
Re:なぜわざわざ独自CPU? (スコア:4, 参考になる)
今回はその独自CPUを売って商売ができます。
既にCrayが富士通のA64FXを載せたスパコンシステム一式を開発していて、例えばイギリスの気象局などが調達することが決まっています。
Re:なぜわざわざ独自CPU? (スコア:3, 参考になる)
今年二月末の資料には、納入予定先として4つ書いてありました。
アメリカ ロスアラモス研究所
アメリカ オークリッジ研究所
アメリカ ストーニーブルック大学
イギリス ブリストル大学
Re: (スコア:0)
中国の研究機関が導入したら本物だろうなぁ
Re:なぜわざわざ独自CPU? (スコア:1)
外為法で輸出できないとか。
Re:なぜわざわざ独自CPU? (スコア:1)
Re:なぜわざわざ独自CPU? (スコア:1)
補助金の正しい使いかたじゃないのこれ
どういう使い道や国庫に戻ってくる流れがお望みですかね?
Re:なぜわざわざ独自CPU? (スコア:1)
富嶽の前にTOP500の1位だったSummitも、その前に1位だった神威も、独自CPUですね。
高性能なスーパーコンピュータを作るためには、CPUそのものよりも、低遅延のインターコネクトが最大のキモだと思う。
で、低遅延の接続を実現するには、汎用CPUの周りにあれこれするより、インターコネクトと直結できる専用のCPUの方が有利。
富嶽のインターコネクト Tofu-D は京の改良型だし、
CPUものA64FXも、命令セットがARMに変わったぐらいで、基本設計はSPARC 64 VIIIfxの改良型。
ハードウェア的には、手堅く京を改良したものだと言えると思う。
でもって、ソフトウェア的にみると「RedHat Linux が動くARMのマルチプロセッサマシン」というわかりやすいものにすることで、GPUカリカリするより格段に「使いやすいスパコン」になった、と言えるかと。Pythonでスーパーコンピューティングできるというお手軽路線。
Tofu-D (スコア:1)
パンダトレノかよ。
Re: (スコア:0)
Power9は一応独自CPUではないよ、一応
Re:なぜわざわざ独自CPU? (スコア:1)
独自CPUを作れる物なら作りたいけど
クレイでもなんでも小さな会社なんでとてもCPUを作れず出来合いのものを買ってくるしかない。
と言うのが米国のスパコン事情という話は聞いたことありますね。
絶対性能で言うなら独自アーキテクチャーの方が良いに決まってるけど
価格性能比で言うなら出来合いのものをそのまま買ってくるとか、
カスタマイズにしても出来合いのものベースの方が安い。
ネットワークにしても独自の物を作る金が無いからInfinibandを使う。
TomOne
Re:なぜわざわざ独自CPU? (スコア:1)
あんたのところはNAND(とメモリ)だけでよかろう
Re: (スコア:0)
Re: (スコア:0)
蓮舫氏「努力に敬意」 スパコン「富岳」世界一で(共同通信) - Yahoo!ニュース [yahoo.co.jp]
要約:私のおかげ
Re:なぜわざわざ独自CPU? (スコア:2)
あんときは与党でしたからねぇ
Re:なぜわざわざ独自CPU? (スコア:2, 興味深い)
https://twitter.com/ohnuki_tsuyoshi/status/1275517605915189248 [twitter.com]
> 京の事業仕分けの議事録を改めて読み直したが、やはりこの件に関しては蓮舫氏が正しい。氏の発言を要約するとこうだ。
議事録から抜粋すると大変なのでこちらの方のツイッター貼るけど、あれは担当者が無能すぎたと思うよ。
というか理研はわざとあの担当者を用意したという話も漏れ聞く。
当時、知り合いが某独行の理事やってて事業仕分けで事業廃止にぶちぎれて理論武装してあの場に挑んだけど
廃止どころか増額もぎ取ってきたのでほんとプレゼン力は重要だなと思ったのを覚えてる。
# あの仕分けの問題点は経済的観点を重視しすぎた点だと思う。
Re:なぜわざわざ独自CPU? (スコア:1)
ARMにして使い勝手が良くなったって、
SPARCは使い勝手が良くないと言ってるのと同じだけど、本当?
アセンブリレベルでチューニングするわけでもあるまいに。
独自命令追加したSPARCと独自命令追加したARMじゃ変わらないのでは?
TomOne
Re:なぜわざわざ独自CPU? (スコア:1)
Re:なぜわざわざ独自CPU? (スコア:1)
Re:なぜわざわざ独自CPU? (スコア:1)
「二度の更新」と言うと聞こえがいいけど、丸ごと総取っ替えで、初代地球シミュレータは7年で廃止、2代目も6年で廃止してるわけで、一度も更新しなかった京は地球シミュレータより長持ちしてると言えるかと。
でもって、地球シミュレータの世代交代を、継続性のある更新だから7年で廃止したわけじゃないとか言うなら、
京は富嶽に更新されたのであり「理化学研究所計算科学研究機構のスパコン」は廃止してない、と主張できそう。
富嶽はハードウェアアーキテクチャ的には順当な京の改良型だし、
更新だからこそ、富嶽を始めるにあたって、まだまだ使えるのに京を廃止したわけで。
Re:なぜわざわざ独自CPU? (スコア:1)
京を使い続けても電気代がかかりすぎるんで廃止みたいですよ。
2012年頃といったら、Intelだと第3世代Core、AMDだとBulldozer。
同じ電気代なら性能が何倍にもなった第10世代CoreやRyzen3を使いたいでしょう。
逆に同じ性能なら電気代が何分の1にもなる。
京の維持費って年間億かかりますから。
TomOne
Re: (スコア:0)
汎用品で一番になれるんですか?
Re:なぜわざわざ独自CPU? (スコア:1)
ARMベースのカスタムチップなんて他にも結構あるから、
「わざわざ独自CPU」というほどの話でもないと思うが。
ARMコアの汎用品といっても、Qualcomm、MediaTek、Samsung、Allwinner、Rockchipとか、沢山選択肢あるわけだし、その中に富士通が紛れ込んでも違和感ないでしょ。
Re: (スコア:0)
二位に三倍近い差をつけたのにケチつけるのがスラド
Re:なぜわざわざ独自CPU? (スコア:1)
> AppleがCPUとGPUを全て自社設計に切り替えると発表したばかりじゃないか
ARMコアでいろいろくっつけたやつなんて、中国のメーカーがいろいろあるわけで、
「自社設計のCPU」というほどのものか、という思いはある。
Power、Alpha みたいに、コアから全然ちがうのならともかく。
Re:なぜわざわざ独自CPU? (スコア:1)
Re:なぜわざわざ独自CPU? (スコア:1)
ポスト「京」のプロセッサ「A64FX」はArmベースながら異彩放つ重厚系 [atmarkit.co.jp]
富岳のA64FXも命令セットがARMなだけで
内部構造は京のSPARK64VIIIfxを踏襲している様ですね。
TomOne
countries performance share (スコア:0)
システム数などでは米中に完全に負けているけど、countries performance shareだと23.7%で結構頑張ってる。
Re: (スコア:0)
中国がここまで伸びるとは思ってなかったなぁ。
日本の(台数?)シェアは10年くらいあまり変わってないのが意外。
ついでに言えば韓国が興味なさそうなのも不思議な気もする。
Re: (スコア:0)
数の力は得意分野でしょ
Re:countries performance share (スコア:1)
日本は歩留まり9割を9割5分にするけど、向こうは9割を二つ作るからね
やっぱArmだな (スコア:0)
スパコンもArm。MacもArm。スマホもArm。自販機もArm。PCだけIntel。
Re:やっぱArmだな (スコア:1)
筆入も
Re: (スコア:0)
PCがARMになったらシングルスレッド性能をコア数で補って、ハイエンドは128コアとかになりそう。
あとはIO用とかスリープ中の低負荷処理とかでいろんな場所にARMが置いてあってメインフレームみたいな分業をするとか、そういうイメージ。
しばらくはなさそうだけど、PS6はARMでも驚かないな。
据え置き型としては既にNintendo SwitchがARMだし。
Re: (スコア:0)
そんなにコア数増やして、キャッシュの一貫性を保つのってるのだろうか?
確かlinuxってャッシュコヒーレンシーが保たれないとうまく動かないんだよね。
カーネルは知らんけど、アプリではそういうコードはたまに見る。
Re: (スコア:0)
F痛「まいどあり〜」
Re: (スコア:0)
ついにMacもARMだな。
Re: (スコア:0)
PCはAMDだろ!
#と言ってみる
マイクロアーキテクチャ公開されてる (スコア:0)
日本版もあるので気軽に読める。
https://github.com/fujitsu/A64FX [github.com]
Re:富士通への財政支援? (スコア:1)
SummitとSierraの性能を足して350億円で割ったのと、富岳を1300億円で割ったのを比べると、
Top500
695TFlops/億円 vs 320TFlops/億円
HPC
13.5TFlops/億円 vs 10.3TFlops/億円
Top500で倍以上だけど、HPCだとそこまで悪くもないと言う感じですね。
TomOne