Google ha annunciato ieri sera il primo modello della famiglia Gemini 2.0. L’azienda di Mountain View ha svelato quattro agenti AI che sfruttano il modello e fornito informazioni sulla nuova TPU (Tensor Processing Unit) utilizzata per l’addestramento (training). Le prestazioni di Gemini 2.0 Flash sono ovviamente superiori a quelle di Gemini 1.5 Flash.
Trillium è la TPU usata per Gemini 2.0
Il modello Gemini 2.0 Flash è stato addestrato con Trillium, la TPU di sesta generazione, disponibile da ieri per tutti i clienti di Google Cloud. L’azienda di Mountain View ha elencato i miglioramenti rispetto alla precedente generazione. Trillium offre un incremento di prestazioni nel training superiore a 4 volte, del throughput nell’inferenza fino a 3 volte e del 67% nell’efficienza energetica.
Gemini 2.0 Flash, disponibile per gli sviluppatori come modello sperimentale tramite API Gemini in Google AI Studio e Vertex AI, supporta input multimodali (immagini, video e audio) e output multimodali (immagini e audio multilingue text-to-speech). Può inoltre accedere a Google Search ed eseguire codice e funzioni di terze parti definite dall’utente.
Il modello viene sfruttato anche da quattro agenti AI: Project Astra, Project Mariner, Project Jules (generatore di codice Python e JavaScript) e un agente che comprende le regole dei giochi.
Google ha pubblicato una tabella con i risultati di alcuni benchmark. Gemini 2.0 Flash supera Gemini 1.5 Flash in tutti i test e Gemini 1.5 Pro in 11 test su 13. Gli utenti di tutto il mondo possono verificare miglioramenti scegliendo “2.0 Flash Experimental” nel menu a tendina di Gemini su web (desktop e mobile). Nei prossimi giorni sarà accessibile anche nell’app mobile.