Imagen è il modello di intelligenza artificiale sviluppato da Google per la generazione di immagini a partire da descrizioni testuali. La versione più recente, Imagen 2, rilasciata a dicembre 2023, si inserisce tra i generatori di immagini AI come DALL-E 3, Stable Diffusion e Midjourney. Questi sistemi, definiti text-to-image, sono in grado di produrre in pochi secondi risultati visivi di alta qualità e dal forte realismo partendo semplicemente da brevi prompt di testo forniti dall’utente.
Imagen 2 è un modello di diffusione, in grado di generare immagini partendo da un rumore casuale e aggiungendo progressivamente sempre maggiori dettagli e precisione. Si tratta di un modello generativo estremamente versatile e potente, in grado di creare immagini artistiche e realistiche al livello dei modelli rivali più avanzati. Imagen 2 è incluso nella suite Vertex AI di Google, accessibile gratuitamente tramite account Google Cloud, e rappresenta uno degli strumenti di punta dell’azienda nel campo dell’intelligenza artificiale generativa per immagini.
- Le differenze tra Imagen e Imagen 2
- Il problema delle mani generate dall’AI
- Come provare Imagen 2
- Come Google ha addestrato il modello Imagen AI?
- Come sapere se le immagini sono state usate per addestrare un modello AI?
- Come fare la richiesta di Opt-Out per negarne esplicitamente l’inclusione delle immagini per l’addestramento dell’AI
Le differenze tra Imagen e Imagen 2
La prima versione di Imagen, lanciata nel maggio 2022, era una versione beta limitata, disponibile solo attraverso un’applicazione chiamata AI Test Kitchen. Con questa applicazione, gli utenti potevano generare solo due tipi di immagini: paesaggi urbani o personaggi mostruosi, con uno stile simile a quello dei film d’animazione della Pixar.
Imagen 2, invece, è un modello molto più avanzato e completo, che può generare qualsiasi tipo di immagine, a partire da una descrizione di testo. Ha anche delle funzioni aggiuntive, come l’inpainting e l’outpainting, che permettono di modificare un’immagine generata, aggiungendo o rimuovendo elementi, o di espandere l’immagine oltre i bordi. Questa funzione è simile a quella di DALL-E, ma Imagen 2 ha anche un vantaggio: la possibilità di usare un’immagine di riferimento quando si genera un’immagine.
Il problema delle mani generate dall’AI
Una delle sfide più difficili per i generatori di immagini AI è quella di creare mani realistiche e proporzionate. Le mani sono, infatti, delle parti del corpo molto complesse e variabili, che richiedono una grande precisione e coerenza visiva. Molti modelli text-to-image fanno fatica a generare mani convincenti, e spesso producono risultati distorti o innaturali.
Imagen 2, tuttavia, ha dimostrato di essere in grado di affrontare meglio questo problema, grazie al suo algoritmo di diffusione e alla possibilità di usare un’immagine di riferimento. I risultati non sono ancora perfetti, ma sono sicuramente migliori di quelli ottenuti da altri modelli. Google ha dedicato molta attenzione a questo aspetto nello sviluppo di Imagen 2, e spera di migliorare ulteriormente le sue prestazioni in futuro.
Come provare Imagen 2
Imagen 2 è un generatore di immagini AI sviluppato da Google principalmente per utilizzo professionale da parte di programmatori e aziende. Ciononostante, anche gli utenti privati possono provare e testare le sue funzionalità in modo gratuito, semplicemente creando un account Google Cloud. È sufficiente cliccare sul pulsante “Inizia gratuitamente” nella parte alta a destra della pagina Google Cloud e seguire la procedura guidata per configurare un account di fatturazione, necessario per accedere alla piattaforma. In questo modo, anche un utente senza competenze tecniche può sperimentare le straordinarie capacità creative di Imagen 2.
Per la fatturazione, è necessario inserire una carta di credito, ma non ci sono rischi di addebiti involontari. Google dichiara esplicitamente che non ci saranno costi automatici al termine del periodo di prova gratuita. Per accedere a Imagen 2 dopo aver creato un account Google Cloud gratuito, è necessario:
- Entrare nella Console Google Cloud dalla homepage, cliccando sul menu in alto a sinistra (le tre linee orizzontali);
- Nel menu laterale, selezionare la voce “Vertex AI Vision” per aprire la relativa pagina;
- A questo punto si può accedere a Studio, l’interfaccia per testare Imagen 2, in due modi: Cliccando su “Apri Studio” nel pannello laterale di sinistra, oppure cliccando sul pulsante “Apri Studio” in alto a destra nella pagina Vertex AI Vision.
Seguendo questi semplici passaggi è possibile iniziare a testare le funzionalità di generazione di immagini di Imagen 2 in modo totalmente gratuito.
Come Google ha addestrato il modello Imagen AI?
L’addestramento di Imagen si basa sul dataset pubblico LAION-400M, integrato con dataset proprietari di Google. A differenza di Imagen, non tutte le aziende operanti nel campo dell’AI rendono note le fonti di dati utilizzate: un esempio è DALL-E, il cui training set non è noto. L’impiego di grandi quantità di dati da parte dei sistemi di intelligenza artificiale è diventato un tema sensibile. In particolare, la pratica di raccogliere milioni di immagini da Internet ha sollevato preoccupazioni sulla violazione di copyright e diritti di proprietà intellettuale.
Molti artisti hanno criticato il fatto che le società di AI acquisiscano immagini e opere d’arte senza richiedere il consenso ai legittimi proprietari, per poi utilizzarle nell’addestramento dei loro modelli senza autorizzazione. Chi ha delle preoccupazioni sulle proprie immagini, può verificare se sono state usate per addestrare un modello di IA e scegliere di non farlo.
Come sapere se le immagini sono state usate per addestrare un modello AI?
Creato da un gruppo di artisti, Spawning è un collettivo il cui scopo è aiutare le persone a scoprire se le loro immagini sono presenti in set di dati come LAION-5B, utilizzati per addestrare modelli di intelligenza artificiale. Il loro motore di ricerca web, chiamato Have I Been Trained?, consente di cercare facilmente parole chiave come il nome dell’artista.
Have I Been Trained funziona come una ricerca di immagini su Google, ma la ricerca viene abbinata ai risultati del dataset LAION-5B. È possibile effettuare la ricerca per parola chiave o per immagine; quest’ultima opzione è utile se si desidera verificare se è stata utilizzata un’immagine esatta.
Come fare la richiesta di Opt-Out per negarne esplicitamente l’inclusione delle immagini per l’addestramento dell’AI
Lo stesso team che ha creato il sito web Have I Been Trained ha creato uno strumento per consentire alle persone di scegliere di entrare o uscire dai sistemi di arte artificiale. È un modo per gli artisti di mantenere il controllo e le autorizzazioni su chi utilizza la loro arte e per quale scopo.
Altre piattaforme artistiche stanno iniziando a seguire l’esempio e attualmente DeviantArt offre un’opzione per escludere le proprie immagini dalla ricerca nei dataset di immagini. È necessario creare un account, quindi fare clic con il tasto destro del mouse su un’immagine e scegliere Opt-out di questa immagine.
Selezionando questa opzione, l’immagine verrà aggiunta all’elenco di opt-out a cui si può accedere facendo clic sul simbolo del proprio account nell’angolo in alto a destra della pagina, quindi selezionando I miei elenchi. Per rimuoverla dall’elenco, fare clic con il tasto destro del mouse sull’immagine e selezionare Rimuovi dall’elenco di opt-out.
Questo metodo è noioso e non è sufficiente per eliminare tutte le immagini in modo efficiente. Purtroppo, al momento non esiste un’alternativa migliore, ma è probabile che in futuro questo sistema venga migliorato. Questi elenchi di opt-out vengono poi trasmessi alla società che sta dietro a LAION-5B, che ha accettato di rimuovere le immagini dal suo set di dati.