A tre mesi di distanza dalla presentazione di Sora, l’accattivante AI text-to-video di OpenAI, Google entra in scena con Veo, il suo ultimo generatore di video AI. Annunciato durante la conferenza I/O per gli sviluppatori, Veo promette di generare video di alta qualità a risoluzione 1080p, con una durata superiore a un minuto e in un’ampia varietà di stili visivi e cinematografici.
Veo si distingue per la sua capacità di comprendere il linguaggio naturale in modo avanzato, consentendogli di interpretare termini cinematografici come “timelapse” o “riprese aeree di un paesaggio”. Gli utenti possono guidare l’output desiderato utilizzando prompt basati su testo, immagini o video, ottenendo risultati più consistenti e coerenti, con movimenti realistici di persone, animali e oggetti durante le riprese.
Google testerà Veo con registi e creatori selezionati
Demis Hassabis, CEO di Google DeepMind, ha evidenziato la possibilità di perfezionare i risultati dei video utilizzando ulteriori prompt. Inoltre, Google sta esplorando funzionalità aggiuntive per consentire a Veo di produrre storyboard e scene più lunghe, ampliando così le possibilità creative offerte dal modello.
Come spesso accade con le anteprime dei modelli di intelligenza artificiale, la maggior parte delle persone dovrà attendere prima di poter provare Veo in prima persona. Google sta invitando registi e creatori selezionati a sperimentare il modello, con l’obiettivo di comprendere come possa supportare al meglio i creativi e garantire loro un ruolo attivo nello sviluppo delle tecnologie AI di Google.
Alcune funzionalità di Veo saranno rese disponibili a creatori selezionati nelle prossime settimane, attraverso un’anteprima privata all’interno di VideoFX. È possibile iscriversi alla lista d’attesa per avere una prima possibilità di provarle. Tuttavia la lista di attesa non è al momento disponibile per gli utenti italiani, per aggirare la limitazione è possibile utilizzare una VPN come NordVPN (scontata del 73% in questi giorni) per poter iscriversi già da ora. Inoltre, Google prevede di integrare alcune delle funzionalità di Veo in YouTube Shorts in futuro.
La concorrenza con OpenAI e Sora
Veo rappresenta l’ultimo passo nell’evoluzione dei modelli di generazione video di Google, che hanno visto progressi significativi negli ultimi anni. Da Phenaki e Imagen Video, che producevano videoclip grezzi e spesso distorti, al modello Lumiere presentato a gennaio, Big G ha dimostrato un costante miglioramento delle capacità dei suoi modelli.
Mentre Google presenta Veo, OpenAI sta già promuovendo Sora a Hollywood e prevede di rilasciarlo al pubblico entro la fine dell’anno. L’azienda sta anche lavorando per incorporare l’audio in Sora e renderlo disponibile direttamente all’interno di applicazioni di editing video come Premiere Pro di Adobe.
Considerando che anche Veo viene proposto come strumento per i registi, il vantaggio di OpenAI potrebbe rendere più difficile la concorrenza del progetto di Google.