GPU 비교 NVIDIA H100 SXM5 80 GB vs NVIDIA GeForce RTX 4090

NVIDIA H100 SXM5 80 GB vs NVIDIA GeForce RTX 4090

AI GPU 주요 사양, 벤치마크 테스트, 전력 소비 등을 기준으로 두 개의 GPU와 데스크톱 플랫폼 GPU를 비교했습니다. 80GB VRAM H100 SXM5 80 GB과 24GB VRAM GeForce RTX 4090 중 어떤 GPU가 성능이 더 우수한지 알아보았습니다.

주요 차이점

NVIDIA H100 SXM5 80 GB 의 장점
출시 6개월 늦었습니다
더 많은 VRAM (80GB 대 24GB)
더 큰 VRAM 대역폭 (1681GB/s 대 1.01TB/s)
512 개의 추가 렌더링 코어
NVIDIA GeForce RTX 4090 의 장점
부스트 클럭 의 성능이 27% 증가했습니다. (2520MHz 대 1980MHz)
낮은 TDP (450W 대 700W)

점수

벤치마크

FP32 (float)
H100 SXM5 80 GB
66.91 TFLOPS
GeForce RTX 4090 +23%
82.58 TFLOPS
VS

그래픽 카드

2023년3월
출시일
2022년9월
Tesla Hopper
세대
GeForce 40
AI GPU
유형
데스크톱
PCIe 5.0 x16
버스 인터페이스
PCIe 4.0 x16

클럭 속도

1590 MHz
기본 클럭
2235 MHz
1980 MHz
부스트 클럭
2520 MHz
1313 MHz
메모리 클럭
1313 MHz

메모리

80GB
메모리 크기
24GB
HBM3
메모리 타입
GDDR6X
5120bit
메모리 버스
384bit
1681GB/s
대역폭
1.01TB/s

렌더링 설정

-
-
-
132
스트림 프로세서 개수
128
16896
새딩 유닛
16384
528
텍스처 매핑 유닛
512
24
렌더 출력 파이프라인
176
528
텐서 코어
512
-
레이 트레이싱 코어
128
256 KB (per SM)
L1 캐시
128 KB (per SM)
50 MB
L2 캐시
72 MB
-
-
-

이론적 성능

47.52 GPixel/s
픽셀 속도
443.5 GPixel/s
1045 GTexel/s
텍스처 속도
1290 GTexel/s
267.6 TFLOPS
FP16 (반 정밀도)
82.58 TFLOPS
66.91 TFLOPS
FP32 (단 정밀도)
82.58 TFLOPS
33.45 TFLOPS
FP64 (배 정밀도)
1290 GFLOPS

보드 디자인

700W
TDP
450W
1100 W
권장 전원 공급 장치
850 W
No outputs
출력 포트
1x HDMI 2.13x DisplayPort 1.4a
8-pin EPS
전원 연결자
1x 16-pin

그래픽 프로세서

GH100
GPU 이름
AD102
-
GPU 변형
AD102-300-A1
Hopper
아키텍처
Ada Lovelace
TSMC
파운드리
TSMC
4 nm
제조 공정 크기
5 nm
800 억
트랜지스터
763 억
814 mm²
다이 크기
609 mm²

그래픽 기능

N/A
DirectX
12 Ultimate (12_2)
N/A
OpenGL
4.6
3.0
OpenCL
3.0
N/A
Vulkan
1.3
9.0
CUDA
8.9
N/A
쉐이더 모델
6.8

관련 GPU 비교

관련 뉴스

© 2024 - TopCPU.net   문의하기 개인정보 처리방침