La Linux Foundation ha annunciato la nascita del nuovo Ultra Ethernet Consortium, di cui fanno parte AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta e Microsoft. L’obiettivo del consorzio è sviluppare un’architettura Ethernet che migliori lo standard attuale per soddisfare i requisiti dei sistemi HPC (High Performance Computing) e di intelligenza artificiale.
Ultra Ethernet per IA e HPC
È noto che l’addestramento dei modelli di intelligenza artificiale generativa richiede un’elevata potenza di calcolo. Il training viene effettuato in data center dedicati, utilizzando migliaia di server con hardware ottimizzato (GPU in particolare). È quindi necessaria una tecnologia di comunicazione migliore di quella attuale, in modo da incrementare la larghezza di banda, ridurre la latenza e limitare le congestioni. Lo stesso discorso è valido per i sistemi HPC.
Lo standard attuale non verrà modificato (anzi è prevista l’interoperabilità). Il consorzio ha istituito quattro gruppi di lavoro, ognuno dei quali si occuperà dello sviluppo di altrettanti livelli: fisico, collegamento, trasporto e software. La priorità è definire un nuovo protocollo per il livello di trasporto, denominato Ultra Ethernet Transport, che offre algoritmi di routing più efficienti e un migliore controllo delle congestioni per consegnare i dati con velocità superiore, riducendo gli errori di trasmissione.
Nel corso dei prossimi mesi verranno pubblicati i documenti tecnici, le specifiche complete e la roadmap. I primi prodotti arriveranno sul mercato nel 2024, ma prima sarà necessario ottenere le certificazioni dall’IEEE (Institute of Electrical and Electronics Engineers). A partire dal quarto trimestre, il consorzio accetterà l’ingresso di altri membri.