Microsoft ha realizzato un chip (nome in codice Athena) che può essere sfruttato per addestrare i cosiddetti LLM (Large Language Model), come GPT-4. Secondo The Information, lo sviluppo è iniziato nel 2019. Alcuni dipendenti dell’azienda di Redmond e di OpenAI hanno già ricevuto il chip per testare la tecnologia. L’obiettivo è ridurre la dipendenza dai produttori di terze parti.
Chip Athena per addestrare i modelli IA
L’addestramento dei modelli IA con miliardi di parametri richiede un’enorme potenza di calcolo. Il training di GPT-3, ad esempio, viene effettuato in specifici data center con server dedicati che consumano quasi 1.300 MWh di elettricità e oltre 3,5 milioni di litri di acqua all’anno.
Secondo TrendForce, GPT-3 usa oltre 30.000 GPU NVIDIA A100 che hanno un prezzo compreso tra 10.000 e 15.000 dollari ognuna, quindi Microsoft vuole ridurre la dipendenza dall’azienda californiana.
Athena viene realizzato da TSMC con tecnologia di processo a 5 nanometri. Non sono noti i dettagli tecnici, ma il chip è già pronto e dovrebbe arrivare sul mercato all’inizio del 2024. Probabilmente sarà disponibile anche ai clienti dei servizi cloud su Azure. Microsoft ha previsto il lancio di future generazioni, pertanto è un investimento a lungo termine.
I chip Athena non prenderanno il posto di quelli venduti da NVIDIA. L’azienda di Redmond potrà però tagliare i costi e soprattutto ottimizzare gli algoritmi di intelligenza artificiale per la sua architettura. Anche Amazon, Google e Meta hanno sviluppato chip in-house, ma attualmente l’addestramento dei modelli IA viene effettuato quasi esclusivamente con i chip di NVIDIA.