Der erste GB10 Grace Blackwell Superchip von NVIDIA, der auf der ARM-Architektur basiert, erschien kürzlich in den Geekbench-Benchmarks. Die offizielle Präsentation wird auf der Computex 2025 in Taipeh Ende Mai 2025 erwartet. Diese könnte einen entscheidenden Schritt für NVIDIA in der Workstationklassen-Domäne der ARM-Prozessoren darstellen. Dank NVIDIAs umfassender Erfahrung in den Bereichen künstliche Intelligenz (KI) und beschleunigtes Computing ist der GB10 bereit, Entwicklern und Forschern erhebliche Rechenleistung zu bieten.
Der GB10 Grace Blackwell ist ein System-on-Chip (SoC), das eine leistungsfähige NVIDIA Grace CPU und eine Blackwell GPU kombiniert, was durch die NVLink-C2C Interconnect-Technologie eine effiziente Datenübertragung ermöglicht. Er ist mit 20 Kernen der ARM-Architektur ausgestattet, darunter 10 leistungsstarke Cortex-X925-Kerne und 10 Cortex-A725-Kerne, die eine maximale Frequenz von 3,9 GHz erreichen. Die Geekbench-Ergebnisse zeigen, dass der GB10 in der Single-Core-Leistung mit High-End-ARM- und x86-Prozessoren konkurriert, obwohl er leicht hinter Apples M4 Max zurückbleibt. Der Chip bietet ausgewogene Multi-Core-Leistung und eignet sich daher hervorragend für KI-Modelltraining, Inferenz und Data-Science-Aufgaben.
Ausgestattet mit 128 GB einheitlichem LPDDR5X-Speicher und einer Speicherbandbreite von bis zu 1 TB/s unterstützt der GB10 bis zu 4 TB NVMe-Speicher. Diese Konfiguration ermöglicht es, Large Language Models (LLMs) mit bis zu 200 Milliarden Parametern lokal zu verarbeiten und 405 Milliarden Parameter dank Dual-Device-Konnektivität über das NVIDIA ConnectX-Netzwerk. Diese Fähigkeit macht ihn zur idealen Plattform für KI-Prototyping, Modellanpassung und Inferenz. Die NVLink-C2C-Technologie überwindet traditionelle PCIe-Engpässe und verbessert die Effizienz bei Hochleistungsrechenaufgaben.
Ein Highlight der GB10-Entwicklung ist die Zusammenarbeit zwischen NVIDIA und MediaTek, die MediaTeks Fähigkeiten im arm-basierten SoC-Design für herausragende Energieeffizienz und Konnektivität nutzt. Geeignet für Desktop-Umgebungen, arbeitet er mit einer Standard-Steckdose. Der Chip, hergestellt im maßgeschneiderten 4NP-Prozess von TSMC, integriert die neuesten CUDA-Cores und Tensor-Cores der 5. Generation und erreicht bis zu 100 Billionen Gleitkommaoperationen (FP4-Präzision) für komplexe KI-Workloads bei hervorragender Energieeffizienz.
Ein neues Anwendungsszenario für den GB10 ist die Integration in den Project DIGITS AI-Supercomputer, eine Desktop-Einheit, die für rund 2.999 US-Dollar angeboten wird und auf der International CES 2025 vorgestellt wird. Project DIGITS nutzt das Linux-basierte NVIDIA DGX-Betriebssystem und unterstützt die NVIDIA AI-Software-Suite, einschließlich des NeMo-Frameworks, der RAPIDS-Bibliothek und beliebter Tools wie PyTorch und Jupyter Notebook. Dies vereinfacht die Entwicklung und das Testen von KI-Modellen. Zudem planen ASUS und Dell, den GB10 in künftige Workstation-Angeboten zu integrieren, um ihre Präsenz im professionellen Markt auszubauen.
Bemerkenswert ist, dass Geekbench-Tests den GB10 fälschlicherweise als Verwendung der Armv8-Architektur anstatt der tatsächlichen Armv9-Architektur kennzeichnen, möglicherweise aufgrund eines Software-Erkennungsproblems. Die Tests wurden in einer Windows-Umgebung durchgeführt, was von der erwarteten Linux-Nutzung abweicht, für die der GB10 hauptsächlich vorgesehen ist. Linux bleibt die primäre Umgebung für den GB10, besonders in KI- und HPC-Kontexten, dank der Linux-Optimierungen, die zentral für das NVIDIA DGX-Ökosystem sind.
Auf der Computex 2025 könnte NVIDIA auch die N1- und N1X-Chips für Desktops und Laptops vorstellen, die auf der GB10-Architektur basieren. Mit Blackwell-GPUs und Arm Cortex-X5-Kernen, LPDDR6-Speicherunterstützung und Fertigung im 3nm-Prozess von TSMC zielt die N1-Serie darauf ab, 150 bis 200 TOPS KI-Performance zu liefern und gegen Windows-on-ARM-Konkurrenten wie Qualcomms Snapdragon X-Serie anzutreten. Dr. Jonathan Tsai, CEO von MediaTek, wird auf der Computex-Keynote sprechen und möglicherweise weitere Details zur NVIDIA-Kooperation preisgeben.
Die Einführung des GB10 unterstreicht NVIDIAs strategischen Fokus auf beschleunigtes Computing und KI, indem die Leistung datenintensiver Aufgaben durch eine einheitliche CPU-GPU-Speicherarchitektur und NVLink-Technologie gesteigert wird. Auch wenn seine CPU-Leistung nicht mit AMD Epyc oder Intel Xeon konkurriert, konsolidiert er die Rechenressourcen für effiziente KI- und Datenverarbeitung. Dies passt gut zu den von KI getriebenen Branchentrends, einschließlich generativer KI, Datenanalyse und wissenschaftlichem Rechnen.
Da die ARM-Architektur im Bereich des Hochleistungsrechnens, bekannt für Energieeffizienz und Flexibilität in Rechenzentren und Edge-Computing, rasch an Bedeutung gewinnt, treibt NVIDIA die Einführung von ARM in Workstations und KI-Entwicklung durch die Nutzung von Grace-CPUs mit Blackwell-GPUs voran. Die fortschrittlichen Fertigungsprozesse von TSMC geben dem GB10 einen Wettbewerbsvorteil in puncto Leistung und Energieeffizienz.
Mit Blick in die Zukunft könnten der GB10 und seine Derivate die Landschaft der Workstations und der KI-Entwicklung verändern. Das modulare Design und das ausgereifte Software-Ökosystem ermöglichen Entwicklern einen nahtlosen Übergang vom lokalen Prototyping zur Cloud-Bereitstellung. NVIDIA plant, die Reichweite des GB10 über die NVIDIA DGX Cloud- und AI Enterprise-Software-Plattformen zu erweitern, um umfangreiche KI-Infrastrukturen zu unterstützen.
Mit beeindruckender Leistung, niedrigerem Stromverbrauch und vielseitigen Anwendungen zeigt der NVIDIA GB10 Grace Blackwell Superchip das Potenzial der ARM-Architektur im Hochleistungsrechnen. Im Vorfeld der Computex 2025 werden weitere Details zum GB10 und seinen verwandten Produkten erwartet, die spannende Entwicklungen für KI-Entwickler, Datenwissenschaftler und Technologie-Enthusiasten versprechen.