AMD、来年MI400を2つのシリーズに分割予定

kyojuro 2025年5月16日金曜日

外国メディアの報道によれば、AMDは2026年の後半に次世代のInstinct MI400シリーズ・アクセラレータをリリース予定です。このシリーズは、主にAI向けに設計されたMI 450 Xと、高性能コンピューティング(HPC)向けに設計されたMI 430 Xの2つの異なるモデルを特徴としています。AMD Instinct MI400

MI400シリーズは、AMDの最新CDNA Nextアーキテクチャ上に構築されています。MI300シリーズはAIとHPCの両方に適していますが、汎用設計のためピーク性能に制限があります。これに対し、MI400シリーズは専門的なソリューションを提供することでこの問題を解決しようとしています。MI 450 XはFP4、FP8、BF16などの低精度計算フォーマットに焦点を当て、FP32およびFP64のロジックを排除してAI機能に特化しています。一方で、MI 430 Xは高精度のFP32およびFP64計算サポートにより低精度AI機能の削除を行い、HPCタスクの向上を目指しています。このターゲットを絞ったアーキテクチャにより、MI 450 XとMI 430 XはAIのトレーニングや推論、科学計算などの分野で優れた性能を発揮します。

技術仕様に関しては、MI400シリーズはメモリ容量と帯域幅におけるAMDの強みを保持すると見られます。MI300シリーズの例で言えば、MI 300 Xは192GBのHBM3メモリを5.3TB/秒の帯域幅で搭載し、MI 325 Xは256GBのHBM3Eと6TB/秒の帯域幅にアップグレードされています。MI400シリーズは最大288GBのメモリとさらに高い帯域幅に達するHBM3EまたはHBM4を採用し、大規模なAIモデルとHPCアプリケーションに対応する可能性があります。MI300Xは、FP8精度で理論ピーク2,614.9TFLOPSを達成し、MI400シリーズはアーキテクチャのアップグレードや3nmプロセスへの移行によるプロセス改善により、これを大幅に強化することが予測されます。

AMD Memory Integration

MI400シリーズの顕著な特徴の一つに、UALinkインターコネクト技術の組み込みがあります。AMDがインテル、マイクロソフトと共同で開発したこの高性能でスケーラブルなGPU相互接続ソリューションは、NvidiaのNVLinkと直接競合します。UALinkは、広範囲なAIおよびHPCクラスタを構築するのに適した高帯域幅、低レイテンシのデータ転送をサポートします。ただし、Astera LabsやEnfabricaのような外部ベンダーが2026年までに成熟したスイッチングシリコンを提供する可能性は低く、商用化には課題があります。そのため、MI400シリーズのUALinkの使用は、AMDがUALinkスイッチのパートナーに依存するため、初期には小さなメッシュまたはリングトポロジに制限される可能性があります。一方で、Ultra Ethernet Consortiumの高度なネットワークソリューションは、代替的なスケーリングオプションを提供するかもしれません。

AMD UALink Interconnect

UALinkの他、MI400シリーズは高スループット、低レイテンシのチップ間通信を保証するAMDのInfinity Fabric技術をサポートし続けます。AMDは、クラスター構成でそれぞれ64GPUと128GPUをサポートするMI 450 X IF 64とMI 450 X IF 128のようなインフィニティファブリックベースのシステムレベルソリューションを導入予定です。これらのセットアップはイーサネット経由で接続し、NvidiaのVR200 NVL 144などのラックレベル製品と対抗します。MI 300 A APUは、統合されたCPU—GPUメモリ構造を通じて最大5.3TB/秒の帯域幅を達成しており、MI400シリーズではさらに改良される見込みです。

MI400のデザインは、モジュラーアーキテクチャにおけるAMDの継続的なイノベーションを反映しています。最近の報告によると、MI 400は2つのアクティブインターポーザーダイを備えたチップレットデザインを搭載し、それぞれ4つの加速コンピューティングダイを収容し、合計8つのXCDを含みます。また、マルチメディアIOダイの導入は、データスループットと処理効率の向上を目指し、性能向上だけでなく、製造コストの最小化と製品の適応性を高めることを目的としています。

MI400シリーズは、NvidiaのHopperおよびBlackwellアーキテクチャと直接競合する市場に位置づけられ、低精度AI最適化および高精度HPCサポートによる卓越した性能向上を狙っています。NvidiaのH100 GPUはFP8で1,978.9 TFLOPSのピークを達成し、AMDのMI 325 Xは既にこの性能を超えています。さらに、AMDのROCmソフトウェアプラットフォームはMI400シリーズをサポートしており、最新のROCmバージョン6.2は推論効率を2.4倍、トレーニング効率を1.8倍に向上させ、FP8やFlash Attention 3などの主要なAI機能を組み込んで、MI400シリーズのソフトウェアエコシステムの競争力を維持します。

ROCm Software Platform

しかしながら、MI400シリーズの課題は依然として存在します。UALinkの制約とは別に、AIにおけるAMDのブランドの影響力は、固有のCUDAエコシステムと初期の市場プレゼンスの恩恵を受けているNvidiaには及びません。AMDは、オープンなROCmプラットフォームと優れた価格/性能の提案を通じてユーザーを引き付けることを目指しています。さらに、急速に進化するAIとHPC市場は、AMDに一貫した反復と迅速な開発を要求します。報告によれば、MI 350シリーズ(CDNA 4アーキテクチャ上に構築)は2025年半ばにリリースされ、FP4とFP6フォーマットを提供し、最大2.3PFLOPSのFP16性能を提供する可能性があります。

AIおよびHPC市場がその需要を拡大し続ける中、ジェネレーティブAIのようなモデル(例:Llama 3.1 70B)は、メモリと計算能力の増加を必要としますが、HPCアプリケーションは精密な計算と大規模なサポートを必要とします。AMDのMI400シリーズは、差別化と専門化の戦略を通じてこれらの課題に対応しています。同時に、UALinkやUltra Ethernetなどのオープンインターコネクト規格の進歩は、より柔軟でスケーラブルなアーキテクチャへの道を開き、AMDのような企業に大きな利益をもたらします。

AMD Instinct MI400シリーズは、カスタマイズされた設計、最先端のインターコネクト、モジュラーアーキテクチャを通じてAIとHPCの力を示威します。MI 450 XとMI 430 Xの発売により、Infinity FabricとUALinkの組み込みにより、クラスタリング展開の可能性を強化した特殊ソリューションが期待できます。相互接続技術と市場競争におけるハードルにもかかわらず、MI400シリーズの革新的な計画とAMDの積極的な開発戦略は、2026年にデータセンターのGPU市場で強力な存在へと導くことが期待されています。

関連ニュース

© 2025 - TopCPU.net