アカウント名:
パスワード:
なぜわざわざ独自CPUを作ったのか?コンペティタは汎用品として売られてるGPU/CPUでスパコン作れてるのにお金がもったいない富士通が自前で最先端のfab/プロセスを持ってるというなら話は分かるがそうでは無いだろ
富嶽の前にTOP500の1位だったSummitも、その前に1位だった神威も、独自CPUですね。
高性能なスーパーコンピュータを作るためには、CPUそのものよりも、低遅延のインターコネクトが最大のキモだと思う。で、低遅延の接続を実現するには、汎用CPUの周りにあれこれするより、インターコネクトと直結できる専用のCPUの方が有利。富嶽のインターコネクト Tofu-D は京の改良型だし、CPUものA64FXも、命令セットがARMに変わったぐらいで、基本設計はSPARC 64 VIIIfxの改良型。ハードウェア的には、手堅く京を改良したものだと言えると思う。
でもって、ソフトウェア的にみると「RedHat Linux が動くARMのマルチプロセッサマシン」というわかりやすいものにすることで、GPUカリカリするより格段に「使いやすいスパコン」になった、と言えるかと。Pythonでスーパーコンピューティングできるというお手軽路線。
> 高性能なスーパーコンピュータを作るためには、CPUそのものよりも、低遅延のインターコネクトが最大のキモだと思う。「高性能=実用性」ではないですが、「"実用性"とか言われても、メモリから正常にデータをロードできて、正しく四則演算が出来て、計算結果をメモリにストアできる機能以上に何を求めるの? [twitter.com]」つまり、キモはない、というスパコンの専門家もいます。
流石にそれは……インターコネクトミジンコレベルでいいならクラウドなりなんなりで適当に大量のパソコンをイーサネットで繋ぐだけで良いってことになってしまう。もうそうなったらスパコンである意味がないと思う。それに用途も著しく制限される。SETI@HomeやFolding@Homeやブロックチェーンなど、そういう状態でもできる分散コンピューティングはあるけどさぁ……
ほんとにスパコンの専門家かな?自分の専門分野の計算しかしたことない人に聞こえるけど。3839858 [srad.jp]の方も書いてますが、完全に分散計算できる系ならインターコネクトなんて通信さえできれば何でもいいと思って正しいですけど、最近はそうじゃない系が多いからTop500以外のランキングも注目されてるのでは?例えば、原子スケールの分子動力学とかやると速いインターコネクトはかなり需要(分子動力学専用のスパコン作る人がいるレベルなのである意味特殊なシミュレーションなのかもしれないけど、コロナの特効薬探索とかでちゃんと計算するとこれを使うこともあるはず)
>ほんとにスパコンの専門家かな?スパコンの研究で今年の春、博士号を取得したばかり、バリバリの専門家です。>自分の専門分野の計算しかしたことない人に聞こえるけど。高精度演算、並列化・高速化、数値計算、ライブラリ開発と幅広い知見を備えている方です。
別ACですが、むしろそういうライブラリ開発者だからそういう視点になっちゃうんだろうね。「数式を記述するだけで高速に演算してくれる環境」と「GPUにデータを配分してロードして演算させて結果を回収して…と、すべて記述する必要がある環境」と、どちらが実用性が高いかといえば、前者なのは明白。
でも、前者が実用性が高いのは数値計算ライブラリなどが充実しているからであり、ツイ主のような、数値計算ライブラリを作る人のおかげで、後者が前者に化ける。でも、数値計算ライブラリを作る人にとっては、全ての環境は後者で、だからこそ「メモリから正常にデータをロ
「数式を記述するだけで高速に演算してくれる環境」と「GPUにデータを配分してロードして演算させて結果を回収して…と、すべて記述する必要がある環境」と、どちらが実用性が高いかといえば、前者なのは明白。
これってソフトウェア環境の話ですよね。ハードウェアについての話に、ソフトウェア環境って無関係じゃないですか。それにtaka2さんは、そのあと「ソフトウェア的にみると」って切り分けてますよ?低遅延のインターコネクトがあるスパコンと、低遅延のインターコネクトがないを、ソフトウェア環境を同一条件にして比較したほうが、低遅延のインターコネクトがキモかどうか、はっきりしませんか?
で、そもそもこのスレの流れでは性能について論じてるのに、まったく無関係な実用性を引き合いに出し、さらに、機能について言及したツイートを持ち出してるのが大間違い。性能と機能を混同した
「メモリから正常にデータをロードできて、正しく四則演算が出来て、計算結果をメモリにストアできる機能」にインターコネクトが介在してるんですが、分かってますか?
1CPUのパソコンならともかく、スパコンで適切なインターコネクトなしにその機能は実現しない。ローカルメモリからだけデータ引っ張ってくればいいなら、スパコンではなくAWS等のクラウドを大量に使っておけばいい。引用したTwitterの発言者は当選それを分かってる。
介在しているけど、「正常に」としか書いていないので、遅延の大きいインターコネクトを使って、遅いまま異常なくデータ転送すれば、ツイートの条件はクリアします。
1CPUのパソコンならともかく、スパコンで適切なインターコネクトなしにその機能は実現しない。
「適切な」って何ですか?遅延の大きいインターコネクトで間接的に連結すれば、ツイートの条件はクリアします。ツイートは、インターコネクトの遅延が低くても高くてもどっちでもいいってなってるから、taka2さんの「低遅延のインターコネクトがキモ」と逆でしょ?(めいっぱい譲って)ツイートの解釈が色々ある中で、taka2さんと逆っていう解釈も可能でしょ?
「正常に」を1ns後なのか1ms後なのか、あるいは1年後でも良いと取るのか。その辺は常識の違いなのでしょうね。もちろんTwitter主の常識ではなく、あなたと私の常識の問題ですが。
すでに共有メモリを使うのでは大規模な演算に対応できないような状況になっているのに。「メモリから正常にデータをロードできて」「計算結果をメモリにストアできる」ってそれだけでも簡単ではないのですよ。
確かに簡単ではないですね。でも、簡単ではないことをしたら、必ず実用的、高性能になったりするわけではないですよね?その辺はどうなっているのですか?
簡単なことをしただけでは、実用的・高性能(大規模な演算が出来るもの)を作ることは出来ないというだけの話。難しいことをやればうまくいくとは言ってない。難しいことをやらないとどうにもならないと言っているだけ。
そんなふうに、菱沼さんがおかしなことを言っているように勝手に改変しないで下さい。PEZYのスパコンは実用的。なぜならメモリから読んで、四則演算して、メモリに書き出すだけで、実用的になるから、というのが菱沼さんの考え [srad.jp]です。
難しいことをやればうまくいくとは言ってない。難しいことをやらないとどうにもならないと言っているだけ。
その解釈だと、PEZYのスパコンは四則演算という難しいことはできるのでどうにもならないわけではないが、実用的というレベルまでではない、と菱沼さんが言っていることになってしまいます。そんな解釈、おかしいでしょう?
菱沼さんのツイートの意味を勝手に変えるコメント [srad.jp]が続いている [srad.jp]ので、元コメントに書いておきます。菱沼さんのツイートの柱は、PEZYのスパコンは実用的だ、ということです。このツイートの前に、(はじめのツイートは非表示みたいですが)PEZYのスパコンはベンチマーク計算以外の実用計算が出来ないと言われてるのですかね? [twitter.com]と質問され、PEZYのスパコンによる応用計算として、菱沼さん自身によるライブラリ移植、流体ソフト移植、ベクトル演算のスタンダードライブラリの実装 [twitter.com]をツイートしています。PEZYの実用性について繰り返し質問され、ライブラリが動くのだから実用性は十分ある、疑問を持つのがおかしい、PEZ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
計算機科学者とは、壊れていないものを修理する人々のことである
なぜわざわざ独自CPU? (スコア:0)
なぜわざわざ独自CPUを作ったのか?
コンペティタは汎用品として売られてるGPU/CPUでスパコン作れてるのにお金がもったいない
富士通が自前で最先端のfab/プロセスを持ってるというなら話は分かるがそうでは無いだろ
Re: (スコア:1)
富嶽の前にTOP500の1位だったSummitも、その前に1位だった神威も、独自CPUですね。
高性能なスーパーコンピュータを作るためには、CPUそのものよりも、低遅延のインターコネクトが最大のキモだと思う。
で、低遅延の接続を実現するには、汎用CPUの周りにあれこれするより、インターコネクトと直結できる専用のCPUの方が有利。
富嶽のインターコネクト Tofu-D は京の改良型だし、
CPUものA64FXも、命令セットがARMに変わったぐらいで、基本設計はSPARC 64 VIIIfxの改良型。
ハードウェア的には、手堅く京を改良したものだと言えると思う。
でもって、ソフトウェア的にみると「RedHat Linux が動くARMのマルチプロセッサマシン」というわかりやすいものにすることで、GPUカリカリするより格段に「使いやすいスパコン」になった、と言えるかと。Pythonでスーパーコンピューティングできるというお手軽路線。
Re:なぜわざわざ独自CPU? (スコア:0)
> 高性能なスーパーコンピュータを作るためには、CPUそのものよりも、低遅延のインターコネクトが最大のキモだと思う。
「高性能=実用性」ではないですが、「"実用性"とか言われても、メモリから正常にデータをロードできて、正しく四則演算が出来て、計算結果をメモリにストアできる機能以上に何を求めるの? [twitter.com]」つまり、キモはない、というスパコンの専門家もいます。
Re: (スコア:0)
流石にそれは……
インターコネクトミジンコレベルでいいなら
クラウドなりなんなりで適当に大量のパソコンを
イーサネットで繋ぐだけで良いってことになってしまう。
もうそうなったらスパコンである意味がないと思う。
それに用途も著しく制限される。
SETI@HomeやFolding@Homeやブロックチェーンなど、
そういう状態でもできる分散コンピューティングはあるけどさぁ……
Re: (スコア:0)
ほんとにスパコンの専門家かな?自分の専門分野の計算しかしたことない人に聞こえるけど。
3839858 [srad.jp]の方も書いてますが、完全に分散計算できる系ならインターコネクトなんて通信さえできれば何でもいいと思って正しいですけど、最近はそうじゃない系が多いからTop500以外のランキングも注目されてるのでは?
例えば、原子スケールの分子動力学とかやると速いインターコネクトはかなり需要(分子動力学専用のスパコン作る人がいるレベルなのである意味特殊なシミュレーションなのかもしれないけど、コロナの特効薬探索とかでちゃんと計算するとこれを使うこともあるはず)
Re: (スコア:0)
>ほんとにスパコンの専門家かな?
スパコンの研究で今年の春、博士号を取得したばかり、バリバリの専門家です。
>自分の専門分野の計算しかしたことない人に聞こえるけど。
高精度演算、並列化・高速化、数値計算、ライブラリ開発と幅広い知見を備えている方です。
Re: (スコア:0)
別ACですが、
むしろそういうライブラリ開発者だからそういう視点になっちゃうんだろうね。
「数式を記述するだけで高速に演算してくれる環境」と
「GPUにデータを配分してロードして演算させて結果を回収して…と、すべて記述する必要がある環境」と、
どちらが実用性が高いかといえば、前者なのは明白。
でも、前者が実用性が高いのは数値計算ライブラリなどが充実しているからであり、
ツイ主のような、数値計算ライブラリを作る人のおかげで、後者が前者に化ける。
でも、数値計算ライブラリを作る人にとっては、全ての環境は後者で、だからこそ「メモリから正常にデータをロ
Re: (スコア:0)
「数式を記述するだけで高速に演算してくれる環境」と
「GPUにデータを配分してロードして演算させて結果を回収して…と、すべて記述する必要がある環境」と、
どちらが実用性が高いかといえば、前者なのは明白。
これってソフトウェア環境の話ですよね。
ハードウェアについての話に、ソフトウェア環境って無関係じゃないですか。それにtaka2さんは、そのあと
「ソフトウェア的にみると」って切り分けてますよ?
低遅延のインターコネクトがあるスパコンと、低遅延のインターコネクトがないを、ソフトウェア環境を同一条件にして比較したほうが、低遅延のインターコネクトがキモかどうか、はっきりしませんか?
で、そもそもこのスレの流れでは性能について論じてるのに、
まったく無関係な実用性を引き合いに出し、
さらに、機能について言及したツイートを持ち出してるのが大間違い。
性能と機能を混同した
Re: (スコア:0)
「メモリから正常にデータをロードできて、正しく四則演算が出来て、計算結果をメモリにストアできる機能」にインターコネクトが介在してるんですが、分かってますか?
1CPUのパソコンならともかく、スパコンで適切なインターコネクトなしにその機能は実現しない。
ローカルメモリからだけデータ引っ張ってくればいいなら、スパコンではなくAWS等のクラウドを大量に使っておけばいい。
引用したTwitterの発言者は当選それを分かってる。
Re: (スコア:0)
「メモリから正常にデータをロードできて、正しく四則演算が出来て、計算結果をメモリにストアできる機能」にインターコネクトが介在してるんですが、分かってますか?
介在しているけど、「正常に」としか書いていないので、遅延の大きいインターコネクトを使って、遅いまま異常なくデータ転送すれば、ツイートの条件はクリアします。
1CPUのパソコンならともかく、スパコンで適切なインターコネクトなしにその機能は実現しない。
「適切な」って何ですか?
遅延の大きいインターコネクトで間接的に連結すれば、ツイートの条件はクリアします。
ツイートは、インターコネクトの遅延が低くても高くてもどっちでもいいってなってるから、taka2さんの「低遅延のインターコネクトがキモ」と逆でしょ?
(めいっぱい譲って)ツイートの解釈が色々ある中で、taka2さんと逆っていう解釈も可能でしょ?
Re: (スコア:0)
「正常に」を1ns後なのか1ms後なのか、あるいは1年後でも良いと取るのか。
その辺は常識の違いなのでしょうね。
もちろんTwitter主の常識ではなく、あなたと私の常識の問題ですが。
Re: (スコア:0)
すでに共有メモリを使うのでは大規模な演算に対応できないような状況になっているのに。
「メモリから正常にデータをロードできて」「計算結果をメモリにストアできる」ってそれだけでも簡単ではないのですよ。
Re: (スコア:0)
確かに簡単ではないですね。でも、簡単ではないことをしたら、必ず実用的、高性能になったりするわけではないですよね?その辺はどうなっているのですか?
Re: (スコア:0)
簡単なことをしただけでは、実用的・高性能(大規模な演算が出来るもの)を作ることは出来ないというだけの話。
難しいことをやればうまくいくとは言ってない。難しいことをやらないとどうにもならないと言っているだけ。
Re: (スコア:0)
そんなふうに、菱沼さんがおかしなことを言っているように勝手に改変しないで下さい。
PEZYのスパコンは実用的。なぜならメモリから読んで、四則演算して、メモリに書き出すだけで、実用的になるから、というのが菱沼さんの考え [srad.jp]です。
難しいことをやればうまくいくとは言ってない。難しいことをやらないとどうにもならないと言っているだけ。
その解釈だと、PEZYのスパコンは四則演算という難しいことはできるのでどうにもならないわけではないが、実用的というレベルまでではない、と菱沼さんが言っていることになってしまいます。
そんな解釈、おかしいでしょう?
Re: (スコア:0)
菱沼さんのツイートの意味を勝手に変えるコメント [srad.jp]が続いている [srad.jp]ので、元コメントに書いておきます。菱沼さんのツイートの柱は、PEZYのスパコンは実用的だ、ということです。
このツイートの前に、(はじめのツイートは非表示みたいですが)PEZYのスパコンはベンチマーク計算以外の実用計算が出来ないと言われてるのですかね? [twitter.com]と質問され、PEZYのスパコンによる応用計算として、菱沼さん自身によるライブラリ移植、流体ソフト移植、ベクトル演算のスタンダードライブラリの実装 [twitter.com]をツイートしています。
PEZYの実用性について繰り返し質問され、ライブラリが動くのだから実用性は十分ある、疑問を持つのがおかしい、PEZ