- 1 : 2023/04/27(木) 11:22:32.13 ID:PXYS2PHp0
-
ディープラーニングが激速に NVIDIAの牙城を崩せるか? SambaNovaに聞く
https://news.yahoo.co.jp/articles/326b043463fa13c1278d467c12436d127f099c67?page=1 - 2 : 2023/04/27(木) 11:22:49.76 ID:PXYS2PHp0
-
ディープラーニングにおいて、NVIDIAのGPUが欠かせないことはもはや一般常識だと思う。いくらAppleが華々しく「Apple Silicon」を喧伝しようが、AMDが「ROCm」を喧伝しようが、ディープラーニングにおいてはNVIDIAのGPUに勝るソリューションは存在しないというのが常識だった。
GPUより高速になる仕組み(a)が従来のGPUによる実行処理 (b)はデータフローによる実行処理
今、この常識に風穴を開けようとするシリコンバレーのスタートアップがある。
それがSambaNova Systems社(以下SambaNova)だ。最近では、日本の最新鋭スーパーコンピュータである「富岳」を運営する理化学研究所計算科学研究センターにも採用されたことで話題になった。しかし日本では全く知られていないこの会社、その勝算は一体どこにあるのか? SambaNovaのカントリーセールスディレクターである鯨岡俊則氏に話を聞いた。
- 3 : 2023/04/27(木) 11:23:11.98 ID:PXYS2PHp0
-
(中略)
データフロー型では、このノイマン型のアプローチをやめ、演算ユニットから演算ユニットへ直接データが流れていきます。メモリとプロセッサの間をデータが往復するのではなく、演算ユニットから演算ユニットへデータを流し込んでいくのです。その結果、高速なメモリが不要になります。現在の実装では1TBのDDR4メモリを搭載しています。
――ちょっと待ってください。通常、GPUに搭載できるメモリ(HBM)は80GB程度が限界ですよね? それがデータフロー型だと1TBまで拡張できると、そう解釈していいんですか?
鯨岡氏 演算ユニットとメモリの間をデータが頻繁に往復しないので、DDRのような一般的なメモリで十分ということですね。
例えば、実際にSambaNovaの再構成可能なデータフローユニット(Reconfigurable Dataflow Unit、RDU)でできることの例として石油開発のために地下の状況を分析する3次元セグメンテーションのタスクがあるんですが、このタスクで比較すると、GPUでは解像度が128x128x128くらいが限界なんですね。ところがRDUを使えば512x512x512と、一目瞭然と言って良いほどに解像度を上げられるわけです。
- 4 : 2023/04/27(木) 11:24:14.54 ID:zHlW5yRl0
-
産婆の婆
- 5 : 2023/04/27(木) 11:24:54.33 ID:PXYS2PHp0
-
(中略)
――具体的には、どの程度の性能差があるんですか?
鯨岡氏 簡単にいえば、同じ規模のシステムで比較して6倍高速です。それまでDGX A100で約300日かかったGPT 13Bの学習が、SambaNovaのRDUを8基搭載したSambaNova DataScaleで約50日で済む計算です。
- 6 : 2023/04/27(木) 11:25:34.85 ID:FBIlZ6YY0
-
日本企業では崩せない
崩れる可能性があるのはMicrosoft、Google、Amazonぐらい - 11 : 2023/04/27(木) 11:30:24.81 ID:HzzBhYk/0
-
>>6,9
シリコンバレーって書いてあんじゃん
何言ってんのお前ら? - 7 : 2023/04/27(木) 11:26:29.88 ID:vgOLoNto0
-
日本語でおk
- 8 : 2023/04/27(木) 11:27:20.73 ID:MbKTF3eg0
-
どうせ高くて普及しないから頭打ちなんだろ
- 9 : 2023/04/27(木) 11:28:07.19 ID:2Xg0zGcZ0
-
中国製ならまだしも日本製じゃダメだろ
- 10 : 2023/04/27(木) 11:29:03.62 ID:rrp64qE30
-
100wくらいでお願いします
- 12 : 2023/04/27(木) 11:32:13.23 ID:5wn2ScN80
-
同じ規模のシステムと比較するとお値段10倍とかなオチ
- 20 : 2023/04/27(木) 11:47:21.10 ID:OLaOIyCX0
-
>>12
10倍の値段で6倍の性能ならお値打ち価格 - 29 : 2023/04/27(木) 12:13:57.48 ID:kw2cG63L0
-
>>20
これな
金を時間で生むシステムとか時間を買うわけだから10倍なら激安だろ - 13 : 2023/04/27(木) 11:32:27.44 ID:FpN5N/Vg0
-
富岳のやつか
実物一度くらい拝んでみたいもんだ - 14 : 2023/04/27(木) 11:32:45.05 ID:VI0C97HQ0
-
戦後体制完全終了したからね
日本が全ての縛りプレイをやめたからね(笑)
全てを日本製に置換するからね(笑) - 15 : 2023/04/27(木) 11:33:17.56 ID:Dpk7t5pQ0
-
GPUというモノではなくソリューション
- 16 : 2023/04/27(木) 11:35:53.53 ID:LTxmUqo/0
-
アメリカ企業じゃん
- 17 : 2023/04/27(木) 11:37:54.99 ID:yMAjigf60
-
日本の工場で作るの?
- 18 : 2023/04/27(木) 11:40:26.41 ID:hYO03IdF0
-
ふしぎの海のNVIDIA
- 19 : 2023/04/27(木) 11:45:36.18 ID:c0sCBkyA0
-
>>18
いーまきーみーのー目にー
いーぃっぱーいーのメーモリー - 21 : 2023/04/27(木) 11:47:47.31 ID:OfbIbkl50
-
(ヾノ・∀・`)ムリムリ
日本のIT産業が凋落したのはスマホで証明済み。 - 31 : 2023/04/27(木) 12:20:17.94 ID:Sz/LQKck0
-
>>21
営業関係者がゴミなだけで技術者自体のレベルは高いよ - 22 : 2023/04/27(木) 11:51:15.89 ID:cI6CaOWF0
-
グラボにもメモリスロット付けて自分でGDDR買ってきて増設できるようなシステムにしてくれんかな
- 23 : 2023/04/27(木) 11:53:56.45 ID:MbKTF3eg0
-
>>22
なんで出来ないの?
すぐ出来そうなもんだけど - 28 : 2023/04/27(木) 12:13:04.37 ID:cI6CaOWF0
-
>>23
そら商売上の理由だろ
iPhoneがメモリスロット付けないのと同じで、できないんじゃなくてやらない - 25 : 2023/04/27(木) 12:05:14.38 ID:+STe5jcL0
-
>>22
むかーし2Dグラボの時代にはあったな - 37 : 2023/04/27(木) 12:28:03.99 ID:VTNntHq00
-
>>22
それな
多少遅くても安いグラボにメモリ3倍積みたいんだこっちは - 24 : 2023/04/27(木) 11:58:55.89 ID:uBTdDBxr0
-
ファイルサーバしか思いつかん
- 26 : 2023/04/27(木) 12:08:03.81 ID:GMqaSXLk0
-
CUDA使えんの?
- 27 : 2023/04/27(木) 12:08:41.70 ID:L86q60Bi0
-
産婆「あっ…(キュッ)」
- 30 : 2023/04/27(木) 12:18:12.05 ID:g6Vao4uL0
-
高速化のため配線長を短くしてるんだから、スロット化は無理だろ
- 32 : 2023/04/27(木) 12:21:12.27 ID:GQHbwp5L0
-
これGPUじゃなくて並列演算ユニットやんか
- 33 : 2023/04/27(木) 12:22:59.46 ID:yrOJtw8K0
-
サンバのリズム
- 34 : 2023/04/27(木) 12:24:10.90 ID:pHq8oA7i0
-
ドライバが全てってマジなんか
- 36 : 2023/04/27(木) 12:27:30.39 ID:VqlrJRgO0
-
アヒルが三羽で…
- 38 : 2023/04/27(木) 12:30:11.58 ID:vHN7dyub0
-
ゲフォもラデも駆逐されるのか!
日本凄い ありがとう安倍晋三、ありがとう高市早苗
コメント