外国メディアの報道によると、 AMD は今木曜日に AI ガソリンペダルの新しい Instinct MI 350 シリーズをリリースします。TSMC の 3 nm プロセスと AMD の最新の CDNA 4 アーキテクチャをベースにした新シリーズは、 NVIDIA の Blackwell シリーズと直接競合する優れた AI コンピューティングパフォーマンスを提供します。 MI350 シリーズは、ハードウェア仕様のブレークスルーを達成するだけでなく、最適化された ROCm ソフトウェアエコシステムを通じて AI アプリケーションの互換性と効率を向上させ、データセンターとハイパースケール AI コンピューティングに強力なサポートを提供します。
MI 350 シリーズのコアハイライトは、高性能ハードウェア構成です。1 枚のカードには、最大 288 GB の HBM 3E ビデオメモリと 8 TB / 秒のメモリ帯域幅が搭載されており、 256 GB のビデオメモリと 6 TB / 秒の帯域幅を備えた前身の MI 325 X と比較して 12.5% と 33.3% 増加しています。計算性能に関しては、 MI350 シリーズは FP 16 、 FP 8 、 FP 6 、 FP 4 などの複数の浮動小数点精度フォーマットをサポートしており、 FP 16 の性能は 18.5 PFlops 、 FP 8 の性能は 37 PFlops 、 FP 6 / FP 4 の性能は 74 PFlops に達します。MI 300 X と比較して、 MI 350 シリーズの FP 16 の性能は約 7.4 倍に増加しました。モデルパラメータ処理能力は 7140 億ドルから 4 兆 2 千億人に急増し、 6 倍近く増加しました。この仕様により、 MI 350 シリーズは、数兆のパラメータを持つ大型言語モデルやハイブリッドエキスパートモデルのトレーニングと推論のニーズに効果的に対応できます。 CDNA 4 アーキテクチャは、 MI 350 シリーズの性能飛躍の鍵となるポイントです。CDNA 3 ベースの MI 325 X と比較して、 CDNA 4 は FP 4 および FP 6 の低精度データ型をサポートし、計算複雑さを劇的に低減し、大規模なモデル量子化および推論タスクに特に適しています。さらに、 3 nm プロセスの適用により、トランジスタ密度とエネルギー効率がさらに向上し、単一カードの消費電力は 1000 W を超え、 NVIDIA B 200 の 1000 W 、 GB 200 の 1700 W と基本的に同じレベルになると予想されます。MI350 シリーズは、最大 2.3TB の合計メモリ容量と最大 64TB / 秒の合計帯域幅を備えたシングルプラットフォーム 8 カード構成をサポートする高度なパッケージング技術も採用しています MI350 シリーズは、最大 2.3TB の合計グラフィックスメモリ容量と最大 64TB / 秒の合計帯域幅を備えたシングルプラットフォーム 8 カード構成をサポートしています。超大規模な AI ワークロードに十分なコンピューティングリソースを提供します ソフトウェアレベルでは、 AMD は MI 350 シリーズの強力なサポートを提供するために ROCm オープンソフトウェアスタックを最適化し続けています。最新バージョンの ROCm 6.2 は、推論パフォーマンスが 6.0 よりも 2.4 倍向上し、トレーニングパフォーマンスが 1.8 倍向上し、 FP 8 データ型、 Flash Attention 3 、 Kernel Fusion などの最先端テクノロジーをサポートしています。 AMD はオープンソースコミュニティと協力して、 PyTorch 、 Triton 、 ONNX などの主流の AI フレームワークを統合しています。MI350 シリーズは、 Stable Diffusion 3 、 Llama 3.1 、および Hugging Face プラットフォーム上の何百万ものモデルなど、人気のあるジェネレティブ AI モデルをシームレスに実行できるようにします。このソフトウェアエコシステムの進歩により、 AMD と NVIDIA CUDA エコシステムのギャップが縮小され、開発者により柔軟な開発環境を提供します。
MI 350 シリーズのリリースは、ハードウェアアップグレードを反映しただけでなく、 AI 市場における AMD の戦略的レイアウトを反映しています。NVIDIA の Blackwell B200 と比較( 192 GB HBM3E 、 8 TB / 秒帯域幅 ) 、 MI350 シリーズは、メモリ容量、同等の帯域幅、および約 35 倍の推論性能で 50% のリードを有し、 Blackwell と Blackwell Ultra の間に位置づけています。Papermaster によると、 MI 350 シリーズは、アーキテクチャとパッケージングの革新を通じて 2025 年までにエネルギー効率を 30 倍に向上させると予想されています。この目標は、 3 nm プロセスの低消費電力特性と低精度コンピューティングのための CDNA 4 アーキテクチャの最適化によって可能になり、 MI 350 は高性能コンピューティングと AI トレーニングにおいてより高い性能対電力比を実証することができます。 MI 350 シリーズは、 Dell 、 Lenovo 、 HP などのパートナーによるサーバープラットフォームに統合される MI 355 X ガソリンペダルを含む製品の最初のバッチで、 2025 年後半に正式に発売される予定です。 AMD は、 CDNA 5 アーキテクチャに基づく MI 400 シリーズの発売も、パフォーマンスと効率をさらに向上させるために、 2026 年に計画しています。現在、 AMD の AI ガスペダルはさまざまなアプリケーションで使用されており、 MI 350 シリーズの発売により、データセンター AI 市場における AMD の競争力をさらに強化します。
しかし、 AMD は AI ハードウェア分野で課題に直面しています。HBM 3 E メモリの供給制約は、 MI 350 の初期生産能力に影響を与える可能性があります。NVIDIA と比較すると、 AMD のリードタイムは 26 週間、 NVIDIA のリードタイムは 52 週間以上であり、高性能 AI チップに対する市場の強い需要を反映しています。さらに、 ROCm エコシステムは急速に発展していますが、 CUDA に比べてエンドツーエンドの機能を改善する必要があります。amd は 100 社以上の AI アプリケーション開発者と提携することでエコシステム構築を加速していますが、実際にどれだけ効果的になるかはまだわかりません。
MI 350 シリーズの発売は、 AI ハードウェア競争における AMD にとって重要なステップです。3 nm プロセス、 CDNA 4 アーキテクチャ、 288 GB の HBM 3 E ビデオメモリの組み合わせは、超大規模 AI モデルの処理に強力なサポートを提供し、 ROCm エコシステムの継続的な最適化は、開発者に柔軟なソフトウェア環境を提供します。MI 350 シリーズは、前身と比較して、パフォーマンス、効率、モデル処理能力の飛躍的な改善を達成し、 NVIDIA Blackwell シリーズとの競争は、 AI ハードウェア市場の技術進歩を牽引します。今後、 AMD の年間製品ロードマップと継続的なアーキテクチャ革新は、 AI コンピューティング分野における地位をさらに確立し、業界により高性能で低コストのソリューションをもたらします。