NVIDIA L40 CNX vs NVIDIA Tesla P100 SXM2

VS

私たちは2つのプロフェッショナル市場向けのGPU：24GBのメモリを搭載した L40 CNX と 16GBのメモリを搭載した Tesla P100 SXM2 を比較しました。両方のグラフィックスカードの主な仕様、ベンチマークテスト、消費電力などの情報を確認できます。

主要な違い

NVIDIA L40 CNX の利点

リリースが6年と 6 ヶ月遅れました

最大ブーストクロックは 67% 向上しました (2475MHz と 1480MHz)

より大きな VRAM (24GB vs 16GB)

より大きなメモリ帯域幅 (864.0GB/s vs 732.2GB/s)

追加されたレンダリングコア数は 14592個です

スコア

ベンチマーク

FP32 (浮動小数点)

L40 CNX +747%

89.97 TFLOPS

Tesla P100 SXM2

10.61 TFLOPS

L40 CNX

VS

Tesla P100 SXM2

グラフィックスカード

2022年10月

リリース日

2016年4月

Tesla Ada

世代

Tesla

プロフェッショナル

タイプ

プロフェッショナル

PCIe 4.0 x16

バスインターフェース

PCIe 3.0 x16

クロック速度

1005 MHz

ベースクロック

1328 MHz

2475 MHz

ブーストクロック

1480 MHz

2250 MHz

メモリクロック

715 MHz

メモリ

24GB

メモリサイズ

16GB

GDDR6

メモリタイプ

HBM2

384bit

メモリバス

4096bit

864.0GB/s

帯域幅

732.2GB/s

レンダリング設定

142

SM数

56

-

計算ユニット

-

18176

シェーディングユニット

3584

568

TMU

224

192

ROP

96

568

テンソルコア

-

142

RTコア

-

128 KB (per SM)

L1キャッシュ

24 KB (per SM)

48 MB

L2キャッシュ

4 MB

理論的な性能

475.2 GPixel/s

ピクセルレート

142.1 GPixel/s

1406 GTexel/s

テクスチャレート

331.5 GTexel/s

89.97 TFLOPS

FP16 (半精度)

21.22 TFLOPS

89.97 TFLOPS

FP32 (単精度)

10.61 TFLOPS

1406 GFLOPS

FP64 (倍精度)

5.304 TFLOPS

グラフィックスプロセッサ

AD102

GPU名

GP100

AD102-???-A1

GPUバリアント

GP100-890-A1

Ada Lovelace

アーキテクチャ

Pascal

TSMC

ファウンドリ

TSMC

4 nm

プロセスサイズ

16 nm

763 億

トランジスタ

153 億

608 mm²

ダイサイズ

610 mm²

ボード設計

300W

TDP

300W

700 W

推奨PSU

700 W

1x HDMI 2.1 3x DisplayPort 1.4a

出力

No outputs

1x 16-pin

電源コネクタ

None

グラフィックス機能

12 Ultimate (12_2)

DirectX

12 (12_1)

4.6

OpenGL

4.6

3.0

OpenCL

3.0

1.3

Vulkan

1.3

8.9

CUDA

6.0

6.6

シェーダモデル

6.4

NVIDIA L40 CNX vs NVIDIA Tesla P100 SXM2

主要な違い

スコア

ベンチマーク

グラフィックスカード

クロック速度

メモリ

レンダリング設定

理論的な性能

グラフィックスプロセッサ

ボード設計

グラフィックス機能

関連GPU比較

関連ニュース