Google aveva annunciato il modello Gemini 2.0 Flash a dicembre, vantando prestazioni superiori rispetto al precedente Gemini 1.5 Pro su diversi parametri chiave e una velocità raddoppiata. Gemini 2.0 Flash supporta input multimodali come immagini, video e audio, e output multimodali come testo, immagini e audio.
L’app di Gemini passa al modello Gemini 2.0 Flash
Ora, Google ha confermato che Gemini 2.0 Flash diventa il modello predefinito per tutti gli utenti dell’app Gemini su web e mobile. Per le prossime settimane, Google continuerà a offrire i modelli precedenti Gemini 1.5 Flash e 1.5 Pro, in modo che gli utenti possano proseguire le conversazioni esistenti.
Patrick Kane del team Gemini ha spiegato che il nuovo modello “offre risposte rapide e prestazioni più solide su diversi parametri chiave, fornendo un aiuto quotidiano per attività come il brainstorming, l’apprendimento o la scrittura“.
L’app Gemini ora include anche Imagen 3, il generatore di immagini all’avanguardia di Google, in grado di creare immagini più accurate in base all’input testuale, con dettagli e texture più ricchi. Sia gli utenti Gemini base che quelli Advanced possono descrivere le immagini che vogliono creare usando il testo e Gemini le genererà con l’AI. Gli utenti Gemini Advanced, però, possono anche creare immagini con persone.
Contesto più ampio e priorità sulle nuove funzioni per Gemini Advanced
Oltre alla disponibilità del nuovo modello Gemini Flash 2.0, gli utenti Gemini Advanced avranno accesso a una finestra di contesto da 1 milione di token, che permetterà loro di caricare un gran numero di file e di avere la priorità su nuove funzioni come Deep Research e altro ancora.
Gli sviluppatori possono ora accedere al modello Gemini 2.0 Flash tramite AI Studio e Vertex AI. La nuova API Multimodal Live supporta input audio e video in streaming in tempo reale e la possibilità di usare più strumenti combinati.