È da segnalare oggi l’ennesimo all-in di Google sul fronte dell’intelligenza artificiale generativa con l’annuncio di tre strumenti dedicati ad altrettanti ambiti: si tratta di ImageFX, MusicFX e TextFX. Come si può intuire già dai nomi scelti, si occupano rispettivamente di creare immagini, suoni e testo.
Google a IA generativa: ImageFX, MusicFX e TextFX
La buona notizia è che il gruppo di Mountain View ha scelto di renderli accessibili fin da subito agli utenti. Quella meno buona è che, per il momento e almeno in via ufficiale, questo non è possibile dall’Italia, ma solo da Stati Uniti, Nuova Zelanda, Kenya e Australia. Chi si trova in uno dei territori selezionati può metterli alla prova fin da ora attraverso la sezione Labs.
ImageFX è basato su Imagen 2, il più recente modello text-to-image predisposto da DeepMind. È caratterizzato da un’interfaccia progettata per favorire la semplicità nell’interazione e fa uso dei cosiddetti expressive chip, suggerimenti mirati per sperimentare variazioni di quanto digitato nel prompt. Qui sotto una demo condivisa attraverso il blog ufficiale.
Gli altri due strumenti, a dire il vero, non sono delle novità assolute, ma oggi accolgono novità importanti. MusicFX, già avvistato lo scorso anno, permette di creare clip o loop musicali da una durata massima di 70 secondi, attraverso un approccio di tipo text-to-music. Fa leva sul modello MusicLM e, stando a quanto dichiarato da bigG, dal suo lancio gli utenti hanno generato oltre 10 milioni di tracce.
L’ultimo è TextFX, realizzato con il contributo del rapper statunitense Lupe Fiasco. È destinato a chi vuole delegare all’intelligenza artificiale la stesura di testi con uno stile creativo.
Bard crea immagini con Imagen 2
L’ultima novità annunciata da Google è quella che vede l’implementazione di Gemini Pro in Bard (per tutte le lingue, italiano compreso) e la possibilità, attraverso l’assistente, di generare immagini.
Anche in questo caso, il modello di IA generativa impiegato è Imagen 2. Trovano così conferma le anticipazioni trapelate nelle scorse settimane. Il rollout è in corso e la funzionalità è gratuita, ma al momento l’unica lingua supportata è l’inglese.