Blackwell Ultra GB300 è il nuovo chip AI di NVIDIA

Blackwell Ultra GB300 è il nuovo chip AI di NVIDIA

NVIDIA ha annunciato la nuova GPU Blackwell Ultra che, abbinata alla CPU Grace, forma il superchip GB300 integrato nella DGX Station.
Blackwell Ultra GB300 è il nuovo chip AI di NVIDIA
NVIDIA ha annunciato la nuova GPU Blackwell Ultra che, abbinata alla CPU Grace, forma il superchip GB300 integrato nella DGX Station.

NVIDIA ha annunciato il supercomputer DGX Station durante la conferenza GTC 2025. Al suo interno è presente il nuovo chip AI Blackwell Ultra GB300 che offre prestazioni notevolmente superiori a quelle della precedente generazione. L’azienda californiana ha inoltre svelato la roadmap fino al 2027.

Blackwell Ultra GB300

Come si deduce dal nome, Blackwell Ultra è una versione aggiornata di Blackwell, quindi non è una nuova architettura. Il superchip integrato nella DGX Station è GB300 formato da una GPU Blackwell Ultra e una CPU Grace. NVIDIA offrirà una soluzione GB300 NVL72 con 72 GPU Blackwell Ultra, 36 CPU Grace (Arm Neoverse V2) e 20 TB di memoria. Le prestazioni sono 1,5 volte superiori a quelle di GB200 NVL72.

Un singolo superchip ha 288 GB di memoria HBM3e, ovvero 96 GB in più rispetto alla precedente generazione. Un cluster DGX SuperPOD è formato da 288 CPU Grace, 576 GPU Blackwell Ultra e 300 TB di memoria. NVIDIA ha dichiarato che il superchip GB300 può eseguire una copia del modello DeepSeek-R1 671B (671 miliardi di parametri), elaborare fino a 1.000 token al secondo e fornire una risposta in appena 10 secondi.

Nella seconda metà del 2025 arriveranno sul mercato i server basati su Blackwell Ultra di vari produttori, tra cui Cisco, Dell, Hewlett Packard Enterprise, Lenovo e Supermicro. Le soluzioni Blackwell Ultra verranno utilizzate anche da molti provider cloud, tra cui Amazon, Google, Microsoft, Oracle e CoreWeave.

Rubin e Feynman

NVIDIA ha fornito anche i primi dettagli sulle prossime GPU. In base alla roadmap, nel secondo semestre 2026 arriverà Rubin con prestazioni fino a 50 petaFLOPS e memorie HBM4. Un anno dopo debutterà Rubin Ultra con prestazioni fino a 100 petaFLOPS e memorie HBM4e.

Vera Rubin è invece il superchip che combina la GPU Rubin alla CPU Vera (88 core Arm). Infine sarà il turno della GPU Feynman nel 2028.

Fonte: NVIDIA
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
19 mar 2025
Link copiato negli appunti