GPU 비교 NVIDIA Tesla P100 SXM2 vs NVIDIA GeForce RTX 4070 Ti

NVIDIA Tesla P100 SXM2 vs NVIDIA GeForce RTX 4070 Ti

주요 사양, 벤치마크 테스트, 전력 소비 등을 기준으로 두 개의 전문 시장 GPU와 데스크톱 플랫폼 GPU를 비교했습니다. 16GB VRAM Tesla P100 SXM2과 12GB VRAM GeForce RTX 4070 Ti 중 어떤 GPU가 성능이 더 우수한지 알아보았습니다.

주요 차이점

NVIDIA Tesla P100 SXM2 의 장점
더 많은 VRAM (16GB 대 12GB)
더 큰 VRAM 대역폭 (732.2GB/s 대 504.2GB/s)
NVIDIA GeForce RTX 4070 Ti 의 장점
출시 6년 그리고 9개월 늦었습니다
부스트 클럭 의 성능이 76% 증가했습니다. (2610MHz 대 1480MHz)
4096 개의 추가 렌더링 코어
낮은 TDP (285W 대 300W)

점수

벤치마크

FP32 (float)
Tesla P100 SXM2
10.61 TFLOPS
GeForce RTX 4070 Ti +277%
40.09 TFLOPS
VS

그래픽 카드

2016년4월
출시일
2023년1월
Tesla
세대
GeForce 40
전문
유형
데스크톱
PCIe 3.0 x16
버스 인터페이스
PCIe 4.0 x16

클럭 속도

1328 MHz
기본 클럭
2310 MHz
1480 MHz
부스트 클럭
2610 MHz
715 MHz
메모리 클럭
1313 MHz

메모리

16GB
메모리 크기
12GB
HBM2
메모리 타입
GDDR6X
4096bit
메모리 버스
192bit
732.2GB/s
대역폭
504.2GB/s

렌더링 설정

56
스트림 프로세서 개수
60
-
컴퓨트 유닛
-
3584
새딩 유닛
7680
224
텍스처 매핑 유닛
240
96
렌더 출력 파이프라인
80
-
텐서 코어
240
-
레이 트레이싱 코어
60
24 KB (per SM)
L1 캐시
128 KB (per SM)
4 MB
L2 캐시
48 MB

이론적 성능

142.1 GPixel/s
픽셀 속도
208.8 GPixel/s
331.5 GTexel/s
텍스처 속도
626.4 GTexel/s
21.22 TFLOPS
FP16 (반 정밀도)
40.09 TFLOPS
10.61 TFLOPS
FP32 (단 정밀도)
40.09 TFLOPS
5.304 TFLOPS
FP64 (배 정밀도)
626.4 GFLOPS

그래픽 프로세서

GP100
GPU 이름
AD104
GP100-890-A1
GPU 변형
AD104-400-A1
Pascal
아키텍처
Ada Lovelace
TSMC
파운드리
TSMC
16 nm
제조 공정 크기
4 nm
153 억
트랜지스터
358 억
610 mm²
다이 크기
295 mm²

보드 디자인

300W
TDP
285W
700 W
권장 전원 공급 장치
600 W
No outputs
출력 포트
1x HDMI 2.1 3x DisplayPort 1.4a
None
전원 연결자
1x 16-pin

그래픽 기능

12 (12_1)
DirectX
12 Ultimate (12_2)
4.6
OpenGL
4.6
3.0
OpenCL
3.0
1.3
Vulkan
1.3
6.0
CUDA
8.9
6.4
쉐이더 모델
6.7

관련 GPU 비교

관련 뉴스

© 2024 - TopCPU.net   문의하기 개인정보 처리방침