GPU 비교 NVIDIA A100 SXM4 40 GB vs NVIDIA H100 SXM5 96 GB

NVIDIA A100 SXM4 40 GB vs NVIDIA H100 SXM5 96 GB

AI GPUAI GPU 주요 사양, 벤치마크 테스트, 전력 소비 등을 기준으로 두 개의 GPU를 비교했습니다. 40GB VRAM A100 SXM4 40 GB과 96GB VRAM H100 SXM5 96 GB

주요 차이점

NVIDIA A100 SXM4 40 GB 의 장점
낮은 TDP (400W 대 700W)
NVIDIA H100 SXM5 96 GB 의 장점
출시 2년 그리고 10개월 늦었습니다
부스트 클럭 의 성능이 30% 증가했습니다. (1837MHz 대 1410MHz)
더 많은 VRAM (96GB 대 40GB)
더 큰 VRAM 대역폭 (1681GB/s 대 1555GB/s)
9984 개의 추가 렌더링 코어

점수

벤치마크

FP32 (float)
A100 SXM4 40 GB
19.49 TFLOPS
H100 SXM5 96 GB +218%
62.08 TFLOPS
VS

그래픽 카드

2020년5월
출시일
2023년3월
Tesla Ampere
세대
Tesla Hopper
AI GPU
유형
AI GPU
PCIe 4.0 x16
버스 인터페이스
PCIe 5.0 x16

클럭 속도

1095 MHz
기본 클럭
1665 MHz
1410 MHz
부스트 클럭
1837 MHz
1215 MHz
메모리 클럭
1313 MHz

메모리

40GB
메모리 크기
96GB
HBM2e
메모리 타입
HBM3
5120bit
메모리 버스
5120bit
1555GB/s
대역폭
1681GB/s

렌더링 설정

-
-
-
108
스트림 프로세서 개수
132
6912
새딩 유닛
16896
432
텍스처 매핑 유닛
528
160
렌더 출력 파이프라인
24
432
텐서 코어
528
-
-
-
192 KB (per SM)
L1 캐시
256 KB (per SM)
40 MB
L2 캐시
50 MB
-
-
-

이론적 성능

225.6 GPixel/s
픽셀 속도
44.09 GPixel/s
609.1 GTexel/s
텍스처 속도
969.9 GTexel/s
77.97 TFLOPS
FP16 (반 정밀도)
248.3 TFLOPS
19.49 TFLOPS
FP32 (단 정밀도)
62.08 TFLOPS
9.746 TFLOPS
FP64 (배 정밀도)
31.04 TFLOPS

보드 디자인

400W
TDP
700W
800 W
권장 전원 공급 장치
1100 W
No outputs
출력 포트
No outputs
None
전원 연결자
8-pin EPS

그래픽 프로세서

GA100
GPU 이름
GH100
-
-
-
Ampere
아키텍처
Hopper
TSMC
파운드리
TSMC
7 nm
제조 공정 크기
4 nm
542 억
트랜지스터
800 억
826 mm²
다이 크기
814 mm²

그래픽 기능

N/A
DirectX
N/A
N/A
OpenGL
N/A
3.0
OpenCL
3.0
N/A
Vulkan
N/A
8.0
CUDA
9.0
N/A
쉐이더 모델
N/A

관련 GPU 비교

관련 뉴스

© 2024 - TopCPU.net   문의하기 개인정보 처리방침