타이니 코프, AMD가 NVIDIA와의 소프트웨어 격차를 거의 좁혔다고 주장

kyojuro 2025년 8월 20일 수요일

인공 컴퓨팅 분야에서 엔비디아(NVIDIA)는 하드웨어의 지속적인 개선뿐만 아니라 소프트웨어의 깊은 레거시에도 힘입어 오랫동안 선두를 유지해 왔습니다. CUDA 생태계는 10년 이상 진화하면서 연구, 산업 및 개발 커뮤니티를 포괄하는 넓은 생태계를 제공합니다. 이렇게 해서 CUDA는 AI 추론 및 훈련의 사실상 표준으로 확고하게 자리 잡았습니다. 그러나 최근 몇 년 동안 AMD는 소프트웨어 스택에 대한 투자를 확장하였습니다. ROCm의 급속한 발전은 AI 소프트웨어 분야에서 "레드 팀"의 잠재력에 대한 새로운 관심을 불러일으켰습니다.

CUDA의 지속되는 강점 2006년에 출시된 이후 CUDA는 GPU 가속 컴퓨팅을 위한 핵심 플랫폼으로 부상했습니다. 그 능력은 고도로 최적화된 프로그래밍 인터페이스를 제공할 뿐만 아니라 포괄적이고 포용적인 생태계를 만드는 데 있습니다. 이에는 cuDNN, TensorRT, 딥러닝 프레임워크 및 개발자 커뮤니티의 지속적인 기여에 대한 네이티브 지원이 포함됩니다. 이러한 포지셔닝 덕분에 연구 기관, 기업 및 개발자는 종종 하드웨어 플랫폼을 선택할 때 CUDA를 선호하며, AI 시장에서 NVIDIA의 '하드웨어 + 소프트웨어' 격차를 강화합니다.

AMD의 급부상과 ROCm의 상승 역사적으로 AMD의 GPU 성능은 종종 NVIDIA의 하드웨어 성능과 경쟁하거나 심지어 능가했습니다. 그러나 소프트웨어 생태계 내에서의 한계는 AI 교육 및 추론 부문에서 장애물이 되었습니다. 이에 대응하여 AMD는 CUDA와 경쟁하도록 설계된, 한때 오픈 소스 GPU 컴퓨팅 프레임워크였던 ROCm 프로젝트에 노력을 강화하였습니다. 초기 버전은 안정성과 호환성 문제로 인해 광범위한 수용을 방해받았지만,

2023년 이후, AMD는 AI를 핵심 기업 전략으로 우선시하며, 주요 딥 러닝 프레임워크를 지원하기 위해 ROCm의 개발을 가속화했습니다. 2025년 출시된 ROCm 7을 통해 AMD는 분산 추론, 사전 인구 및 분해와 같은 핵심 기능을 소개하며, 추론 성능 최적화에 집중하였습니다. 이러한 혁신 덕분에 ROCm은 특정 시나리오에서 CUDA와 경쟁하거나 심지어 능가할 수 있었습니다. 예를 들어 DeepSeek의 R 1 FP8 처리량 평가에서 ROCm은 탁월한 효율성을 보여주었습니다.

업계 피드백 및 Tiny Corp의 평가 AI 스타트업 Tiny Corp는 AMD와 NVIDIA의 소프트웨어 격차가 점차 줄어들고 있다고 관찰했습니다. 이 회사는 만약 NVIDIA가 특정 제품 세대나 소프트웨어 아키텍처에서 실수를 한다면, AMD는 서버 CPU 분야에서 인텔에 대한 승리를 재현할 기회를 잡을 수 있다고 주장합니다. Tiny Corp의 의견은 역사적으로 CUDA에 의존했지만, 이제는 ROCm에 관심을 갖고 있는 개발자 커뮤니티 일부를 반영합니다. 특히 향상된 오픈 소스 요소와 크로스 플랫폼 기능을 고려하면 더욱 그렇습니다. CUDA에 매여 있는 대신, 개발자들은 이제 ROCm을 탐구하는 경향이 증가하고 있습니다.

진화하는 개발자 생태계와 크로스 플랫폼 호환성 ROCm을 발전시킴으로써 AMD는 진입 장벽을 점차 해체하고 있습니다. 올해가 진행됨에 따라 ROCm은 Ryzen 기반 노트북 및 워크스테이션을 지원하여 모든 Linux 및 Windows 플랫폼에서 호환성을 보장합니다. 이 개발은 데이터 센터뿐만 아니라 데스크탑 사용자, 중소기업이 AMD 플랫폼에서 AI 프레임워크를 사용할 수 있게 확장합니다. 동시에 ROCm 7과 함께 AMD는 vLLM v1, llm-d 및 SGLang과 같은 프레임워크를 지원하여 AI 애플리케이션의 적극적인 도입을 강조합니다.

개발자 생태계 측면에서, CUDA는 광범위한 커뮤니티와 풍부한 도구를 가지고 있지만 ROCm의 오픈 소스 특성은 AMD의 레버리지 포인트가 될 수 있습니다. 점점 더 많은 연구 기관과 오픈 소스 커뮤니티가 ROCm 기반 솔루션을 포팅하고 최적화하고 있습니다. 이러한 추진력이 지속된다면, 생태계의 격차는 줄어들 것입니다.

남아있는 도전 ROCm의 급속한 진화에도 불구하고, 여전히 주목할 만한 도전이 산재해 있습니다. 10년 동안 CUDA의 지배력은 수많은 연구 결과, 소프트웨어 라이브러리 및 엔터프라이즈 애플리케이션이 NVIDIA 생태계 내에 깊이 자리잡고 있음을 의미합니다. 개발자를 전환하도록 설득하기 위해서는 단순히 성능이 동등한 수준 이상이 필요합니다. 동등한 문서화 품질, 도구체인 가용성 및 광범위한 생태계 지원이 필수적입니다. 또한 일부 AI 기업은 ROCm의 장기적인 안정성에 대해 우려하며, 생태계의 성장을 위해 자원을 투자하려는 AMD의 지속적인 약속을 의심하고 있습니다.

전략적 영향 AMD가 ROCm을 CUDA의 진정한 대안으로 업그레이드한다면 전략적 영향은 막대할 것입니다. AI 소프트웨어 생태계에 대한 NVIDIA의 통제권을 깨뜨리고 개방적인 경쟁을 유발할 뿐만 아니라 사용자에게 더 많은 하드웨어 옵션을 제공하고 비용을 절감하며 유연성을 높일 것입니다. AMD가 이 분야에서 승리한다면, 이는 인텔에 대한 Zen 아키텍처의 서버 시장 승리를 반영하는 것이며, AMD의 전략적 선견과 투자를 구체화할 것입니다.

앞으로, ROCm의 개발 속도와 개발자 커뮤니티의 수용은 매우 중요할 것입니다. 단기적으로 CUDA의 우월성은 여전히 도전을 받지 않는 것으로 보입니다. 그러나 ROCm은 주변에서 주류로 전환할 가능성을 암시합니다. ROCm의 소프트웨어 강화로 인해 데이터 센터에서 Instinct MI 시리즈 가속기 카드의 배포가 증가함에 따라 AMD는 추론과 교육 분야에서 강력한 솔루션을 만들어낼 수 있었습니다. 이러한 추세가 지속된다면 NVIDIA의 AI 우월성은 비교할 수 없는 도전에 직면할 수 있습니다.

관련 뉴스

© 2025 - TopCPU.net