ホーム GPU比較 NVIDIA L40 CNX vs NVIDIA Tesla P100 SXM2

NVIDIA L40 CNX vs NVIDIA Tesla P100 SXM2

私たちは2つのプロフェッショナル市場向けのGPU:24GBのメモリを搭載した L40 CNX と 16GBのメモリを搭載した Tesla P100 SXM2 を比較しました。両方のグラフィックスカードの主な仕様、ベンチマークテスト、消費電力などの情報を確認できます。

主要な違い

NVIDIA L40 CNX の利点
リリースが6年 と 6 ヶ月 遅れました
最大ブーストクロックは 67% 向上しました (2475MHz と 1480MHz)
より大きな VRAM (24GB vs 16GB)
より大きなメモリ帯域幅 (864.0GB/s vs 732.2GB/s)
追加されたレンダリングコア数は 14592個です

スコア

ベンチマーク

FP32 (浮動小数点)
L40 CNX +747%
89.97 TFLOPS
Tesla P100 SXM2
10.61 TFLOPS
VS

グラフィックスカード

2022年10月
リリース日
2016年4月
Tesla Ada
世代
Tesla
プロフェッショナル
タイプ
プロフェッショナル
PCIe 4.0 x16
バスインターフェース
PCIe 3.0 x16

クロック速度

1005 MHz
ベースクロック
1328 MHz
2475 MHz
ブーストクロック
1480 MHz
2250 MHz
メモリクロック
715 MHz

メモリ

24GB
メモリサイズ
16GB
GDDR6
メモリタイプ
HBM2
384bit
メモリバス
4096bit
864.0GB/s
帯域幅
732.2GB/s

レンダリング設定

142
SM数
56
-
計算ユニット
-
18176
シェーディングユニット
3584
568
TMU
224
192
ROP
96
568
テンソルコア
-
142
RTコア
-
128 KB (per SM)
L1キャッシュ
24 KB (per SM)
48 MB
L2キャッシュ
4 MB

理論的な性能

475.2 GPixel/s
ピクセルレート
142.1 GPixel/s
1406 GTexel/s
テクスチャレート
331.5 GTexel/s
89.97 TFLOPS
FP16 (半精度)
21.22 TFLOPS
89.97 TFLOPS
FP32 (単精度)
10.61 TFLOPS
1406 GFLOPS
FP64 (倍精度)
5.304 TFLOPS

グラフィックスプロセッサ

AD102
GPU名
GP100
AD102-???-A1
GPUバリアント
GP100-890-A1
Ada Lovelace
アーキテクチャ
Pascal
TSMC
ファウンドリ
TSMC
4 nm
プロセスサイズ
16 nm
763 億
トランジスタ
153 億
608 mm²
ダイサイズ
610 mm²

ボード設計

300W
TDP
300W
700 W
推奨PSU
700 W
1x HDMI 2.1 3x DisplayPort 1.4a
出力
No outputs
1x 16-pin
電源コネクタ
None

グラフィックス機能

12 Ultimate (12_2)
DirectX
12 (12_1)
4.6
OpenGL
4.6
3.0
OpenCL
3.0
1.3
Vulkan
1.3
8.9
CUDA
6.0
6.6
シェーダモデル
6.4

関連GPU比較

関連ニュース

© 2024 - TopCPU.net   お問い合わせ プライバシーポリシー