Google sta lavorando instancabilmente per migliorare il suo generatore di immagini AI, e l’annuncio di Imagen 3 promette di rivoluzionare il settore. Questo nuovo modello text-to-image, attualmente disponibile in anteprima privata per creatori selezionati su ImageFX, offre un livello di dettaglio straordinario, una migliore comprensione del linguaggio naturale e una resa del testo senza precedenti.
Il lancio di Imagen 3 si aggiunge ai numerosi annunci entusiasmanti fatti al Google I/O, tra cui il lancio di un nuovo modello di generazione video chiamato Veo.
Imagen 3 di Google: il modello AI più efficiente
Douglas Eck, senior research director di Google DeepMind, ha dichiarato con entusiasmo durante la conferenza I/O dell’azienda: “È il nostro modello di generazione di immagini più efficiente“. Imagen 3 si distingue per il suo fotorealismo, con dettagli più ricchi e una riduzione significativa di artefatti visivi o immagini distorte.
Questo modello all’avanguardia è in grado di comprendere le richieste testuali nel modo in cui le persone si esprimono naturalmente: più creativi e dettagliati sono gli input, migliori saranno i risultati.
Una delle caratteristiche più impressionanti di Imagen 3 è la sua capacità di incorporare anche i più piccoli dettagli nelle richieste più lunghe. Inoltre, questo modello stabilisce nuovi standard per il rendering del testo, una sfida notoriamente complessa per i generatori di immagini AI.
La corsa all’AI: Google in prima linea
L’annuncio di Imagen 3 arriva sei mesi dopo che Google ha reso Imagen 2 generalmente disponibile su Vertex AI e ha lanciato la funzionalità text-to-live per generare i video ad aprile. Questi progressi sono fondamentali per Google, che mira a rimanere un passo avanti rispetto ai suoi concorrenti nel campo dell’intelligenza artificiale, come OpenAI con DALL-E, Midjourney, Adobe con Firefly, Meta con la sua AI, Microsoft con Designer e molti altri.
Nonostante i notevoli progressi, il percorso di Google nel settore dell’AI generativa non è stato privo di ostacoli. All’inizio di quest’anno, l’azienda è stata accusata di essere “troppo progressista” dopo che la sua AI ha generato immagini dei padri fondatori degli Stati Uniti con un uomo di colore e immagini di soldati tedeschi della Seconda Guerra Mondiale con un uomo di colore e una donna asiatica. Google si è scusata, riconoscendo di aver mancato il bersaglio, e l’amministratore delegato Sundar Pichai ha ribadito questo messaggio durante un’intervista con Emily Chang di Bloomberg.