NVIDIA L40 CNX vs AMD Instinct MI300A

VS

NVIDIA L40 CNX

AMD Instinct MI300A

私たちは2つのプロフェッショナル市場向けのGPU：24GBのメモリを搭載した L40 CNX と 128GBのメモリを搭載した AMD Instinct MI300A を比較しました。両方のグラフィックスカードの主な仕様、ベンチマークテスト、消費電力などの情報を確認できます。

主要な違い

NVIDIA L40 CNX の利点

最大ブーストクロックは 18% 向上しました (2475MHz と 2100MHz)

追加されたレンダリングコア数は 3584個です

より低いTDP電力 (300W と 760W)

AMD Instinct MI300A の利点

リリースが1年と 2 ヶ月遅れました

より大きな VRAM (128GB vs 24GB)

より大きなメモリ帯域幅 (5300GB/s vs 864.0GB/s)

スコア

ベンチマーク

FP32 (浮動小数点)

L40 CNX

89.97 TFLOPS

AMD Instinct MI300A +36%

122.6 TFLOPS

L40 CNX

VS

AMD Instinct MI300A

グラフィックスカード

2022年10月

リリース日

2023年12月

Tesla Ada

世代

Instinct

プロフェッショナル

タイプ

プロフェッショナル

PCIe 4.0 x16

バスインターフェース

PCIe 5.0 x16

クロック速度

1005 MHz

ベースクロック

1000 MHz

2475 MHz

ブーストクロック

2100 MHz

2250 MHz

メモリクロック

5200 MHz

メモリ

24GB

メモリサイズ

128GB

GDDR6

メモリタイプ

HBM3

384bit

メモリバス

8192bit

864.0GB/s

帯域幅

5300GB/s

レンダリング設定

-

計算ユニット

228

142

SM数

-

18176

シェーディングユニット

14592

568

TMU

880

192

ROP

0

568

テンソルコア

-

142

RTコア

-

128 KB (per SM)

L1キャッシュ

16 KB (per CU)

48 MB

L2キャッシュ

16 MB

-

理論的な性能

475.2 GPixel/s

ピクセルレート

0 MPixel/s

1406 GTexel/s

テクスチャレート

1496 GTexel/s

89.97 TFLOPS

FP16 (半精度)

980.6 TFLOPS

89.97 TFLOPS

FP32 (単精度)

122.6 TFLOPS

1406 GFLOPS

FP64 (倍精度)

61.3 TFLOPS

ボード設計

300W

TDP

760W

700 W

推奨PSU

1000 W

1x HDMI 2.1 3x DisplayPort 1.4a

出力

No outputs

1x 16-pin

電源コネクタ

None

グラフィックスプロセッサ

AD102

GPU名

MI300

AD102-???-A1

GPUバリアント

-

Ada Lovelace

アーキテクチャ

CDNA 3.0

TSMC

ファウンドリ

TSMC

4 nm

プロセスサイズ

5 nm

763 億

トランジスタ

1460 億

608 mm²

ダイサイズ

1017 mm²

グラフィックス機能

12 Ultimate (12_2)

DirectX

N/A

4.6

OpenGL

N/A

3.0

OpenCL

3.0

1.3

Vulkan

N/A

8.9

CUDA

-

6.6

シェーダモデル

N/A

NVIDIA L40 CNX vs AMD Instinct MI300A

主要な違い

スコア

ベンチマーク

グラフィックスカード

クロック速度

メモリ

レンダリング設定

理論的な性能

ボード設計

グラフィックスプロセッサ

グラフィックス機能

関連GPU比較

関連ニュース