Dopo aver annunciato il cambio di nome per Bard e la disponibilità del modello Gemini Ultra in Gemini Advanced, Google ha ora introdotto il nuovo modello Gemini 1.5 in versione Pro. Quest’ultimo è accessibile anche agli sviluppatori e ai clienti cloud tramite AI Studio e Vertex AI.
Notevoli miglioramenti con Gemini 1.5
Google afferma che ci sono molti miglioramenti rispetto alla prima versione del modello. Gemini 1.5 offre prestazioni notevolmente superiori e sfrutta la nuova architettura Mixture-of-Experts (MoE) che permette di incrementare l’efficienza durante l’addestramento e l’inferenza.
Grazie a MoE, i modelli sono attivati in maniera selettiva. Ciò significa che, quando viene inviato un input, si attiva solo una parte del modello, riducendo latenza e consumi. La “context window” standard di Gemini 1.5 Pro è 128.000 token (quella di Gemini 1.0 Pro era 32.000), ma gli sviluppatori e i clienti cloud possono accedere in anteprima privata ad una versione con una context window di un milione di token (Google ha testato anche un context window da 10 milioni di token).
Gemini 1.5 Pro può quindi elaborare un’ora di video, 11 ore di audio, oltre 30.000 linee di codice e oltre 700.000 parole. Il nuovo modello è in grado di analizzare e riassumere un documento di 402 pagine della missione Apollo 11 e descrivere il film Sherlock Jr. di Buster Keaton (44 minuti).
Rispetto alla versione 1.0 Pro, le prestazioni nell’elaborazione di test, codice, immagini, audio e video sono aumentate dell’87% e sono quasi simili a quelle di Gemini 1.0 Ultra. L’anteprima privata di Gemini 1.5 è accessibile agli sviluppatori tramite AI Studio e ai clienti cloud tramite Vertex AI. In futuro verranno introdotti vari tipi di abbonamento in base alla context window.