Microsoft ha avviato lo sviluppo di un nuovo LLM (Large Language Model) che potrà sfidare Gemini di Google e GPT-4 di OpenAI. Secondo le fonti di The Information, il modello è chiamato MAI-1 e avrà circa 500 miliardi di parametri.
Primo lavoro per Mustafa Suleyman
Microsoft ha integrato Copilot in vari servizi e Windows 11. L’assistente digitale è tuttavia basato sul modello GPT-4 di OpenAI. Tra le due aziende esiste un accordo miliardario che prevede l’uso dei modelli GPT e DALL-E da parte di Microsoft, mentre OpenAI sfrutta l’infrastruttura di Azure per l’addestramento.
L’azienda di Redmond ha sviluppato diversi modelli IA (alcuni sono open source) di piccole dimensioni. Secondo The Information, MAI-1 ha invece circa 500 miliardi di parametri, quindi appartiene alla stessa categoria di Gemini (Google) e GPT-4 (OpenAI). Sembrerebbe quindi che Microsoft voglia fare concorrenza all’azienda guidata da Sam Altman. In realtà, GPT-4 mantiene ancora un discreto vantaggio (ha oltre 1.000 miliardi di parametri).
Per l’addestramento verranno utilizzati server con GPU NVIDIA e dati provenienti da varie fonti, tra cui quelli pubblici su Internet e il testo generato da GPT-4. A capo del progetto c’è Mustafa Suleyman, ex co-fondatore di Inflection AI e CEO di Microsoft AI. Un’anteprima dl modello potrebbe essere mostrata durante la conferenza Build 2024 (21-23 maggio).
Una conferma indiretta è arrivata dal Chief Technology Officer Kevin Scott tramite un post su LinkedIn. Il dirigente sottolinea che non è una novità, in quanto Microsoft realizza supercomputer per l’addestramento dei modelli di OpenAI e da molti anni sviluppa modelli IA, alcuni dei quali sono open source.