Durante l’evento COMPUTEX 2023 in corso a Taipei NVIDIA ha stupito tutti non solo con ACE for Games, sistema che conferisce più personalità agli NPC dei videogiochi sfruttando un modello di linguaggio simile a quello di ChatGPT, ma anche una nuova classe di supercomputer IA. Stiamo parlando di NVIDIA DGX GH200, alimentato dai superchip GH200 Grace Hopper e dal sistema switch NVIDIA NVLink.
NVIDIA propone i supercomputer IA del futuro
Ad annunciare questa imponente novità giusto poche ore fa è stato Jensen Huang, fondatore e CEO di NVIDIA, il quale ha chiaramente parlato di IA generativa e modelli di linguaggio di grandi dimensioni come i “motori digitali dell’economia moderna”, che necessitano di supercomputer ancora più performanti ed efficienti al fine di soddisfare la richiesta del pubblico, aziende o privati che siano.
Integrando le più avanzate tecnologie di elaborazione di NVIDIA all’interno di DGX GH200, il colosso statunitense prevede di alimentare l’espansione della frontiera dell’IA in men che non si dica.
Scendendo nel dettaglio, i superchip GH200 eliminano la necessità di una tradizionale connessione PCIe CPU-GPU combinando una CPU basata su Arm con una GPU H100 Tensor Core nello stesso pacchetto, sfruttando il sistema proprietario NVLink-C2C. In questo modo, la larghezza di banda tra GPU e CPU aumenta di sette volte rispetto allo standard PCIe, e il consumo energetico viene ridotto di oltre cinque volte.
DGX GH200 diventa così il primo sistema con tali soluzioni avanzate, per un totale di 256 superchip GH200 capaci di operare come singola GPU al fine di fornire 1 exaflop di prestazioni e 144 terabyte di memoria condivisa, ovvero quasi 500 volte più memoria rispetto alla precedente generazione NVIDIA DGX A100.
Il primo supercomputer IA basato su DGX GH200 sarà NVIDIA Helios, avrà quattro sistemi DGX GH200 e sfrutterà la connessione NVIDIA Quantum-2 InfiniBand per potenziare il throughput dei dati per l’addestramento di modelli IA di grandi dimensioni. Quando diventerà attivo? Presumibilmente entro fine 2023. A richiederne l’uso saranno Google Cloud, Meta e Microsoft, clienti già confermati dalla stessa azienda di Jensen Huang.