NVIDIA ha annunciato il supercomputer DGX Station durante la conferenza GTC 2025. Al suo interno è presente il nuovo chip AI Blackwell Ultra GB300 che offre prestazioni notevolmente superiori a quelle della precedente generazione. L’azienda californiana ha inoltre svelato la roadmap fino al 2027.
Blackwell Ultra GB300
Come si deduce dal nome, Blackwell Ultra è una versione aggiornata di Blackwell, quindi non è una nuova architettura. Il superchip integrato nella DGX Station è GB300 formato da una GPU Blackwell Ultra e una CPU Grace. NVIDIA offrirà una soluzione GB300 NVL72 con 72 GPU Blackwell Ultra, 36 CPU Grace (Arm Neoverse V2) e 20 TB di memoria. Le prestazioni sono 1,5 volte superiori a quelle di GB200 NVL72.
Un singolo superchip ha 288 GB di memoria HBM3e, ovvero 96 GB in più rispetto alla precedente generazione. Un cluster DGX SuperPOD è formato da 288 CPU Grace, 576 GPU Blackwell Ultra e 300 TB di memoria. NVIDIA ha dichiarato che il superchip GB300 può eseguire una copia del modello DeepSeek-R1 671B (671 miliardi di parametri), elaborare fino a 1.000 token al secondo e fornire una risposta in appena 10 secondi.
Nella seconda metà del 2025 arriveranno sul mercato i server basati su Blackwell Ultra di vari produttori, tra cui Cisco, Dell, Hewlett Packard Enterprise, Lenovo e Supermicro. Le soluzioni Blackwell Ultra verranno utilizzate anche da molti provider cloud, tra cui Amazon, Google, Microsoft, Oracle e CoreWeave.
Rubin e Feynman
NVIDIA ha fornito anche i primi dettagli sulle prossime GPU. In base alla roadmap, nel secondo semestre 2026 arriverà Rubin con prestazioni fino a 50 petaFLOPS e memorie HBM4. Un anno dopo debutterà Rubin Ultra con prestazioni fino a 100 petaFLOPS e memorie HBM4e.
Vera Rubin è invece il superchip che combina la GPU Rubin alla CPU Vera (88 core Arm). Infine sarà il turno della GPU Feynman nel 2028.