Grazie al recente aggiornamento, DALL-E 3 include ora una nuova funzionalità di editing che consente di modificare e migliorare le immagini in modo semplice e veloce, inserendo una breve richiesta testuale che descrive la modifica desiderata. Ad esempio, è possibile correggere eventuali problemi o imperfezioni presenti nell’immagine, come un oggetto deformato o un volto poco nitido.
Oppure si possono aggiungere nuovi elementi come sfondi diversi o altri oggetti. Inoltre, si può intervenire su parti specifiche dell’immagine per renderle più nitide e definite, ad esempio ingrandendo una sezione o migliorandone la risoluzione. In questo modo, è possibile modificare un’immagine senza avere particolari conoscenze tecniche o di editing avanzato.
Che cos’è DALL-E?
DALL-E è il generatore di immagini AI di OpenAI. È stato lanciato per la prima volta nel gennaio 2021 e l’ultima versione è la sua terza iterazione. Il modello genera immagini sulla base di input in linguaggio naturale, i cosiddetti prompt. In altre parole, fornita una richiesta testuale, il modello comprende il linguaggio e crea immagini accurate e rappresentative della descrizione che gli è stata data.
Una curiosità: i creatori hanno inventato il nome “DALL-E” fondendo insieme i nomi di Salvador Dalì, il famoso artista surrealista spagnolo, e WALL-E, il robot del film della Pixar del 2008.
Dal suo debutto “in società”, DALL-E ha subito più aggiornamenti. Un aspetto che DALL-E, DALL-E 2 e DALL-E 3 hanno in comune è che sono tutti modelli text-to-image sviluppati utilizzando tecniche di deep learning, che permettono agli utenti di generare immagini AI a partire dal linguaggio naturale. A parte questo, ci sono parecchie differenze.
La prima versione di DALL-E utilizzava una versione di GPT-3 modificata per generare immagini. Un anno dopo, nel 2022, è arrivato DALL-E 2, in grado di generare immagini di qualità superiore utilizzando un modello di diffusione stabile (come Midjourney e Stable Diffusion), combinando concetti, attributi e stili.
Questo ci porta ai giorni nostri. A settembre 2023, infatti, OpenAI ha annunciato DALL-E 3. Secondo il team di OpenAI, DALL-E 3 è in grado di comprendere “molte più sfumature e dettagli” rispetto ai suoi predecessori. In particolare, il modello segue richieste complesse con maggiore precisione e genera immagini più coerenti, oltre a consentire la modifica delle immagini e a integrarsi in ChatGPT.
Come modificare le immagini con DALL-E 3
Con DALL-E 3, modificare le immagini è un gioco da ragazzi! Ecco tutto quello che si può fare con la nuova funzione di editing.
1. Cambiare il colore degli oggetti
Con DALL-E 3 è possibile modificare determinati aspetti di un’immagine esistente. Ad esempio, si può chiedere all’AI di generare prima una foto realistica di una ciambella con la glassa. Una volta ottenuta l’immagine iniziale, è possibile modificare il colore della glassa inserendo una richiesta testuale come: “Per favore, cambia il colore della glassatura in rosa“.
DALL-E 3 modificherà l’immagine in modo da rendere la glassa di colore rosa, lasciando tutti gli altri elementi invariati. Quindi con brevi prompt è possibile indicare all’IA esattamente come editare l’immagine, ad esempio cambiando i colori di oggetti specifici in modo rapido e semplice.
2. Rimuovere oggetti
Quando si generano immagini con qualunque modello text-to-image, spesso si ottiene un prototipo/bozza da cui partire per ulteriori modifiche. A volte, ci sono elementi nell’immagine originale che non si desidera mantenere. In questi casi, la nuova funzione di editing di DALL-E 3 consente di rimuovere facilmente gli oggetti indesiderati.
Ad esempio, si può chiedere a DALL-E di generare la scena di una strada a Roma. Nell’immagine risultante potrebbe esserci un’auto in primo piano che però non si vuole nella versione finale. A questo punto, selezionando l’auto e inserendo la richiesta “rimuovi l’automobile nera“, DALL-E 3 modificherà l’immagine eliminando quel preciso oggetto indesiderato.
La funzione di editing testuale di DALL-E 3 perciò, permette di rimuovere elementi specifici dall’immagine iniziale, per ottenere esattamente ciò che si desidera nella versione finale.
3. Correggere eventuali problemi
Quando si generano immagini con l’AI, a volte possono esserci alcuni difetti o imperfezioni, come bandiere dalla forma strana o errori di ortografia su testi presenti nell’immagine. In questi casi, invece di rimuovere completamente gli elementi, è possibile fare una correzione grazie alla funzione di editing testuale.
Il procedimento è lo stesso visto in precedenza: si seleziona l’area dell’immagine da modificare e si inserisce una richiesta testuale specifica per indicare a DALL-E 3 come intervenire. Ad esempio, per sistemare una bandiera dalla forma anomala, si può scrivere: “Raddrizza la bandiera e rendila rettangolare“. Oppure, per correggere un errore di ortografia su un cartello, si può dire: “Correggi la parola Xxx con la parola corretta Yyy“.
4. Modificare aspetto e stile delle persone
La nuova funzionalità di editing testuale di DALL-E 3 permette di modificare facilmente l’aspetto delle persone nelle immagini. Ad esempio, si può chiedere a DALL-E di generare l’immagine di una persona, ad esempio: “Un giovane uomo che lavora per un’azienda tecnologica, vestito in modo smart casual“.
Una volta ottenuta l’immagine iniziale, se si vuole cambiare l’abbigliamento basta selezionare la persona e inserire il prompt di modifica, ad esempio: “Cambia i suoi vestiti con un completo elegante blu scuro“. DALL-E 3 aggiornerà l’immagine in modo che la persona indossi gli abiti indicati nella richiesta testuale.
5. Aggiungere nuovi sfondi
Con DALL-E 3 è possibile modificare facilmente lo sfondo delle immagini. Ad esempio, si può chiedere all’AI di creare un paesaggio e di cambiare il cielo inizialmente generato. Basta selezionare l’area del cielo e inserire una richiesta testuale come “Sostituisci il cielo con un tramonto infuocato“.
DALL-E 3 aggiornerà l’immagine, modificando lo sfondo con il nuovo cielo al tramonto specificato nel prompt. Questa funzione di editing può essere utilizzata anche per cambiare i colori dello sfondo in un ritratto o lo sfondo di una foto. Selezionando l’area e indicando i colori desiderati nel prompt di modifica testuale. In questo modo è possibile ottenere l’immagine con lo sfondo che si preferisce.
6. Cambiare la posizione di un oggetto
DALL-E 3 consente anche di modificare la posizione di oggetti specifici all’interno dell’immagine. Questo può essere utile ad esempio per ritoccare la composizione di un ritratto o una scena. Ad esempio, si può prima generare l’immagine di un lago, con un isolotto al centro, poi si può chiedere all’AI di spostare l’isola più indietro.
DALL-E è in grado di eseguire la modifica spostando l’isola. In generale, bisogna indicare chiaramente dove e quanto si vuole spostare un oggetto. Se lo spazio nell’immagine è limitato, può essere necessario generare una nuova versione con una composizione più adatta alle modifiche richieste.
7. Aggiungere riflessi
DALL-E 3 permette di aggiungere o modificare i riflessi nelle immagini. Ad esempio, se si vuole aggiungere dei riflessi sull’acqua di un lago, dopo aver generato l’immagine iniziale è possibile selezionare la zona del lago e inserire una richiesta come “Aggiungi riflessi realistici sulla superficie dell’acqua“.
DALL-E 3 aggiornerà l’immagine inserendo i riflessi richiesti. Bisogna però fare attenzione perché a volte, modificando alcuni elementi, l’AI potrebbe cambiare completamente prospettiva e composizione. Quindi può essere necessario fare diversi tentativi specificando con precisione dove si vogliono i riflessi e come dovrebbero apparire, ad esempio: “Mantenendo la stessa prospettiva, aggiungi riflessi realistici solo sulla parte inferiore del lago“. Come sempre, maggiori sono i dettagli nel prompt, migliore sarà il risultato.
8. Rendere più nitide alcune parti dell’immagine
La qualità delle immagini generate dall’AI a volte può non essere ottimale, con alcune zone dell’immagine che appaiono sgranate o sfocate. In questi casi è possibile migliorare la nitidezza di aree specifiche dell’immagine utilizzando la funzione di editing testuale.
Ad esempio, se si nota che un edificio sullo sfondo appare poco definito, è possibile selezionare quella zona e inserire nel prompt una richiesta come “Rendi l’edificio sullo sfondo più nitido e definito“. DALL-E 3 elaborerà di nuovo l’immagine, migliorando la nitidezza della zona indicata.
9. Aggiungere nuovi soggetti
Con DALL-E 3 è possibile modificare le immagini generate aggiungendo nuovi soggetti come persone o animali. Ad esempio, se si vuole aggiungere un cane ad una scena di famiglia, dopo aver ottenuto l’immagine iniziale è possibile selezionare la zona dove si desidera far apparire il cane e inserire nel prompt testuale una richiesta tipo: “Aggiungi un golden retriever seduto sul pavimento con sguardo felice in basso a destra.”
DALL-E 3 genererà una nuova versione dell’immagine con il cane nella posizione specificata. Se la prima modifica altera troppo la scena originale, si può provare a selezionare nuovamente la zona desiderata e ripetere la richiesta testuale finché non si ottiene il risultato sperato.