Laut ausländischen Medienberichten wird AMD am Donnerstag die neue Instinct MI350 - Serie von KI-Gaspedalen veröffentlichen, ein Produkt, das einen weiteren wichtigen Fortschritt in der KI-Hardware des Unternehmens markiert. Basierend auf dem 3nm-Prozess von TSMC und der neuesten CDNA 4 - Architektur von AMD kann die neue Serie überlegene KI-Computing - Leistung liefern und direkt mit der Blackwell-Serie von NVIDIA konkurrieren. Die MI350 - Serie erzielt nicht nur Durchbrüche in den Hardware-Spezifikationen, sondern verbessert auch die Kompatibilität und Effizienz von KI-Anwendungen durch das optimierte ROCm-Software - Ökosystem und bietet leistungsstarke Unterstützung für Rechenzentren und hyperscale KI-Computing.
Das Kernhighlight der MI350 - Serie ist ihre Hochleistungs-Hardware - Konfiguration. Eine einzelne Karte ist mit bis zu 288 GB HBM3E-Videospeicher und einer Speicherbandbreite von 8 TB / s ausgestattet, was eine Steigerung von 12,5% und 33,3% im Vergleich zu seinem Vorgänger, der MI325X, mit 256 GB Videospeicher und 6 TB / s Bandbreite. In Bezug auf die Rechenleistung unterstützt die MI350 - Serie mehrere Gleitkomma-Präzisionsformate wie FP16, FP8, FP6 und FP4, wobei die Leistung von FP16 18,5 PFlops, FP8 37 PFlops und FP6 / FP4 bis zu 74 PFlops beträgt. Im Vergleich zum MI300X hat sich die FP16 - Leistung der MI350 - Serie um das 7,4 - fache erhöht. Die Verarbeitungskapazität der Modellparameter stieg von 714 Milliarden auf 4,2 Billionen, ein Anstieg um fast das 6 - fache. Diese Spezifikation ermöglicht es der MI350 - Serie, die Trainings - und Argumentationsbedürfnisse großer Sprachmodelle und hybrider Expertenmodelle mit Billionen von Parametern effektiv zu erfüllen. Die CDNA - 4 - Architektur ist der Schlüsselpunkt des Leistungssprungs der MI350 - Serie. Im Vergleich zum CDNA 3 - basierten MI325X führt CDNA 4 die Unterstützung für die niedrigpräzisen Datentypen FP4 und FP6 ein, wodurch die Rechenkomplexität dramatisch reduziert wird und es besonders für große Modellquantierung und Inferenz-Aufgaben geeignet ist. Darüber hinaus verbessert die Anwendung des 3nm-Prozesses die Transistordichte und die Energieeffizienz weiter, und der Stromverbrauch einer einzelnen Karte wird voraussichtlich über 1000W betragen, im Grunde das gleiche Niveau wie NVIDIA B200 's 1000W und GB200 's 1700W. Die MI350 - Serie verfügt außerdem über eine fortschrittliche Verpackungstechnologie, die eine Single-Plattform - Acht-Karten - Konfiguration mit einer Gesamtspeicherkapazität von bis zu 2,3 TB und einer Gesamtbandbreite von bis zu 64 TB / s unterstützt. Bereitstellung ausreichender Rechenressourcen für ultra-große KI-Worklasten. Auf Software-Ebene optimiert AMD weiterhin seinen ROCm Open-Software - Stack, um die MI350 - Serie stark zu unterstützen Die neueste Version, ROCm 6.2, bietet eine 2,4 - fache Verbesserung der Inferenzleistung gegenüber 6.0, eine 1,8 - fache Verbesserung der Trainingsleistung und Unterstützung für modernste Technologien wie FP8 - Datentypen, Flash Attention 3 und Kernel Fusion. AMD hat mit der Open-Source - Community zusammengearbeitet, um Mainstream-KI - Frameworks wie PyTorch, Triton, ONNX und andere zu integrieren. Damit die MI350 - Serie beliebte generative KI-Modelle wie Stable Diffusion 3, Llama 3.1 und Millionen von Modellen auf der Hugging Face-Plattform nahtlos ausführen kann. Diese Entwicklung des Software - Ökosystems verringert die Lücke zwischen AMD und NVIDIA CUDA - Ökosystemen und bietet Entwicklern eine flexiblere Entwicklungsumgebung.
Die Veröffentlichung der MI350 - Serie spiegelt nicht nur Hardware-Upgrades wider, sondern spiegelt auch das strategische Layout von AMD im KI-Markt wider. Im Vergleich zum Blackwell B200 von NVIDIA Mit 192 GB HBM3E, 8 TB / s Bandbreite verfügt die MI350 - Serie über einen 50% höheren Vorsprung bei der Speicherkapazität, vergleichbare Bandbreite und etwa 35 - mal höhere Inferenzleistung, wodurch sie zwischen Blackwell und Blackwell Ultra positioniert wird. Papermaster erwartet, dass die MI350 - Serie bis 2025 durch Architektur - und Verpackungsinnovationen eine 30 - fache Verbesserung der Energieeffizienz bietet. Dieses Ziel wird durch die niedrige Leistungsfähigkeit des 3nm-Prozesses und die Optimierung der CDNA 4 - Architektur für die Berechnung mit niedriger Präzision ermöglicht, wodurch der MI350 ein höheres Leistungsverhältnis im Hochleistungsrechnen (HPC) und im KI-Training demonstriert. Die MI350 - Serie wird voraussichtlich in der zweiten Hälfte des Jahres 2025 offiziell auf den Markt gebracht werden, wobei die erste Produktreihe einschließlich des MI355X-Gaspedals, das von Partnern wie Dell, Lenovo, HP usw. in Serverplattformen integriert wird, AMD plant auch, die MI400 - Serie auf der Basis der CDNA 5 - Architektur im Jahr 2026 auf den Markt zu bringen, um die Leistung und Effizienz weiter zu verbessern. Derzeit werden AMDs KI-Gaspedal in einer Vielzahl von Anwendungen eingesetzt, und die Veröffentlichung der MI350 - Serie wird die Wettbewerbsfähigkeit von AMD auf dem KI-Markt für Rechenzentren weiter festigen.
AMD steht jedoch noch vor Herausforderungen im KI-Hardware - Bereich. Versorgungsbeschränkungen im HBM3E-Speicher können die anfängliche Produktionskapazität des MI350 beeinträchtigen. Im Vergleich zu NVIDIA beträgt AMDs Vorlaufzeit 26 Wochen, während NVIDIAs mehr als 52 Wochen beträgt, was die starke Nachfrage nach leistungsstarken KI-Chips auf dem Markt widerspiegelt. Darüber hinaus muss sich das ROCm - Ökosystem, obwohl sich rasch entwickelt, im Vergleich zu CUDA noch eine Verbesserung der End-to - End-Funktionalität vornehmen. amd beschleunigt den Aufbau des Ökosystems, indem es mit mehr als 100 KI-Anwendungsentwicklern zusammenarbeitet, und es ist schwer zu sagen, wie effektiv es in der Praxis sein wird.
Die Veröffentlichung der MI350 - Serie ist ein wichtiger Schritt für AMD im Wettbewerb im Bereich KI-Hardware. Die Kombination des 3nm-Prozesses, der CDNA 4 - Architektur und 288 GB HBM3E-Videospeicher bietet starke Unterstützung für die Verarbeitung von ultra-großen KI-Modellen, während die kontinuierliche Optimierung des ROCm - Ökosystems Entwicklern eine flexible Softwareumgebung bietet. Im Vergleich zu ihrem Vorgänger erzielt die MI350 - Serie sprunghafte Verbesserungen in Bezug auf Leistung, Effizienz und Modellverarbeitung, und die Konkurrenz mit der NVIDIA Blackwell-Serie wird technologische Fortschritte auf dem KI-Hardware - Markt vorantreiben. In Zukunft werden AMDs jährliche Produkt-Roadmap und kontinuierliche Architekturinnovationen seine Position im Bereich KI-Computing weiter festigen und der Branche mehr leistungsstarke, kostengünstige Lösungen bringen.