ホーム GPU比較 NVIDIA L40 CNX vs AMD Instinct MI300A

NVIDIA L40 CNX vs AMD Instinct MI300A

私たちは2つのプロフェッショナル市場向けのGPU:24GBのメモリを搭載した L40 CNX と 128GBのメモリを搭載した AMD Instinct MI300A を比較しました。両方のグラフィックスカードの主な仕様、ベンチマークテスト、消費電力などの情報を確認できます。

主要な違い

NVIDIA L40 CNX の利点
最大ブーストクロックは 18% 向上しました (2475MHz と 2100MHz)
追加されたレンダリングコア数は 3584個です
より低いTDP電力 (300W と 760W)
AMD Instinct MI300A の利点
リリースが1年 と 2 ヶ月 遅れました
より大きな VRAM (128GB vs 24GB)
より大きなメモリ帯域幅 (5300GB/s vs 864.0GB/s)

スコア

ベンチマーク

FP32 (浮動小数点)
L40 CNX
89.97 TFLOPS
AMD Instinct MI300A +36%
122.6 TFLOPS
VS

グラフィックスカード

2022年10月
リリース日
2023年12月
Tesla Ada
世代
Instinct
プロフェッショナル
タイプ
プロフェッショナル
PCIe 4.0 x16
バスインターフェース
PCIe 5.0 x16

クロック速度

1005 MHz
ベースクロック
1000 MHz
2475 MHz
ブーストクロック
2100 MHz
2250 MHz
メモリクロック
5200 MHz

メモリ

24GB
メモリサイズ
128GB
GDDR6
メモリタイプ
HBM3
384bit
メモリバス
8192bit
864.0GB/s
帯域幅
5300GB/s

レンダリング設定

-
計算ユニット
228
142
SM数
-
18176
シェーディングユニット
14592
568
TMU
880
192
ROP
0
568
テンソルコア
-
142
RTコア
-
128 KB (per SM)
L1キャッシュ
16 KB (per CU)
48 MB
L2キャッシュ
16 MB
-
-
-

理論的な性能

475.2 GPixel/s
ピクセルレート
0 MPixel/s
1406 GTexel/s
テクスチャレート
1496 GTexel/s
89.97 TFLOPS
FP16 (半精度)
980.6 TFLOPS
89.97 TFLOPS
FP32 (単精度)
122.6 TFLOPS
1406 GFLOPS
FP64 (倍精度)
61.3 TFLOPS

ボード設計

300W
TDP
760W
700 W
推奨PSU
1000 W
1x HDMI 2.1 3x DisplayPort 1.4a
出力
No outputs
1x 16-pin
電源コネクタ
None

グラフィックスプロセッサ

AD102
GPU名
MI300
AD102-???-A1
GPUバリアント
-
Ada Lovelace
アーキテクチャ
CDNA 3.0
TSMC
ファウンドリ
TSMC
4 nm
プロセスサイズ
5 nm
763 億
トランジスタ
1460 億
608 mm²
ダイサイズ
1017 mm²

グラフィックス機能

12 Ultimate (12_2)
DirectX
N/A
4.6
OpenGL
N/A
3.0
OpenCL
3.0
1.3
Vulkan
N/A
8.9
CUDA
-
6.6
シェーダモデル
N/A

関連GPU比較

関連ニュース

© 2024 - TopCPU.net   お問い合わせ プライバシーポリシー