9 trucchi per modificare le immagini con DALL-E 3

Grazie al recente aggiornamento, DALL-E 3 include ora una nuova funzionalità di editing che consente di modificare e migliorare le immagini in modo semplice e veloce, inserendo una breve richiesta testuale che descrive la modifica desiderata. Ad esempio, è possibile correggere eventuali problemi o imperfezioni presenti nell’immagine, come un oggetto deformato o un volto poco nitido.

Oppure si possono aggiungere nuovi elementi come sfondi diversi o altri oggetti. Inoltre, si può intervenire su parti specifiche dell’immagine per renderle più nitide e definite, ad esempio ingrandendo una sezione o migliorandone la risoluzione. In questo modo, è possibile modificare un’immagine senza avere particolari conoscenze tecniche o di editing avanzato.

Che cos’è DALL-E?
Come modificare le immagini con DALL-E 3

Che cos’è DALL-E?

DALL-E è il generatore di immagini AI di OpenAI. È stato lanciato per la prima volta nel gennaio 2021 e l’ultima versione è la sua terza iterazione. Il modello genera immagini sulla base di input in linguaggio naturale, i cosiddetti prompt. In altre parole, fornita una richiesta testuale, il modello comprende il linguaggio e crea immagini accurate e rappresentative della descrizione che gli è stata data.

Una curiosità: i creatori hanno inventato il nome “DALL-E” fondendo insieme i nomi di Salvador Dalì, il famoso artista surrealista spagnolo, e WALL-E, il robot del film della Pixar del 2008.

Dal suo debutto “in società”, DALL-E ha subito più aggiornamenti. Un aspetto che DALL-E, DALL-E 2 e DALL-E 3 hanno in comune è che sono tutti modelli text-to-image sviluppati utilizzando tecniche di deep learning, che permettono agli utenti di generare immagini AI a partire dal linguaggio naturale. A parte questo, ci sono parecchie differenze.

La prima versione di DALL-E utilizzava una versione di GPT-3 modificata per generare immagini. Un anno dopo, nel 2022, è arrivato DALL-E 2, in grado di generare immagini di qualità superiore utilizzando un modello di diffusione stabile (come Midjourney e Stable Diffusion), combinando concetti, attributi e stili.

Questo ci porta ai giorni nostri. A settembre 2023, infatti, OpenAI ha annunciato DALL-E 3. Secondo il team di OpenAI, DALL-E 3 è in grado di comprendere “molte più sfumature e dettagli” rispetto ai suoi predecessori. In particolare, il modello segue richieste complesse con maggiore precisione e genera immagini più coerenti, oltre a consentire la modifica delle immagini e a integrarsi in ChatGPT.

Come modificare le immagini con DALL-E 3

Con DALL-E 3, modificare le immagini è un gioco da ragazzi! Ecco tutto quello che si può fare con la nuova funzione di editing.

1. Cambiare il colore degli oggetti

Con DALL-E 3 è possibile modificare determinati aspetti di un’immagine esistente. Ad esempio, si può chiedere all’AI di generare prima una foto realistica di una ciambella con la glassa. Una volta ottenuta l’immagine iniziale, è possibile modificare il colore della glassa inserendo una richiesta testuale come: “Per favore, cambia il colore della glassatura in rosa“.

DALL-E 3 modificherà l’immagine in modo da rendere la glassa di colore rosa, lasciando tutti gli altri elementi invariati. Quindi con brevi prompt è possibile indicare all’IA esattamente come editare l’immagine, ad esempio cambiando i colori di oggetti specifici in modo rapido e semplice.

2. Rimuovere oggetti

Quando si generano immagini con qualunque modello text-to-image, spesso si ottiene un prototipo/bozza da cui partire per ulteriori modifiche. A volte, ci sono elementi nell’immagine originale che non si desidera mantenere. In questi casi, la nuova funzione di editing di DALL-E 3 consente di rimuovere facilmente gli oggetti indesiderati.

Ad esempio, si può chiedere a DALL-E di generare la scena di una strada a Roma. Nell’immagine risultante potrebbe esserci un’auto in primo piano che però non si vuole nella versione finale. A questo punto, selezionando l’auto e inserendo la richiesta “rimuovi l’automobile nera“, DALL-E 3 modificherà l’immagine eliminando quel preciso oggetto indesiderato.

La funzione di editing testuale di DALL-E 3 perciò, permette di rimuovere elementi specifici dall’immagine iniziale, per ottenere esattamente ciò che si desidera nella versione finale.

3. Correggere eventuali problemi

Quando si generano immagini con l’AI, a volte possono esserci alcuni difetti o imperfezioni, come bandiere dalla forma strana o errori di ortografia su testi presenti nell’immagine. In questi casi, invece di rimuovere completamente gli elementi, è possibile fare una correzione grazie alla funzione di editing testuale.

Il procedimento è lo stesso visto in precedenza: si seleziona l’area dell’immagine da modificare e si inserisce una richiesta testuale specifica per indicare a DALL-E 3 come intervenire. Ad esempio, per sistemare una bandiera dalla forma anomala, si può scrivere: “Raddrizza la bandiera e rendila rettangolare“. Oppure, per correggere un errore di ortografia su un cartello, si può dire: “Correggi la parola Xxx con la parola corretta Yyy“.

4. Modificare aspetto e stile delle persone

La nuova funzionalità di editing testuale di DALL-E 3 permette di modificare facilmente l’aspetto delle persone nelle immagini. Ad esempio, si può chiedere a DALL-E di generare l’immagine di una persona, ad esempio: “Un giovane uomo che lavora per un’azienda tecnologica, vestito in modo smart casual“.

Una volta ottenuta l’immagine iniziale, se si vuole cambiare l’abbigliamento basta selezionare la persona e inserire il prompt di modifica, ad esempio: “Cambia i suoi vestiti con un completo elegante blu scuro“. DALL-E 3 aggiornerà l’immagine in modo che la persona indossi gli abiti indicati nella richiesta testuale.

5. Aggiungere nuovi sfondi

Con DALL-E 3 è possibile modificare facilmente lo sfondo delle immagini. Ad esempio, si può chiedere all’AI di creare un paesaggio e di cambiare il cielo inizialmente generato. Basta selezionare l’area del cielo e inserire una richiesta testuale come “Sostituisci il cielo con un tramonto infuocato“.

DALL-E 3 aggiornerà l’immagine, modificando lo sfondo con il nuovo cielo al tramonto specificato nel prompt. Questa funzione di editing può essere utilizzata anche per cambiare i colori dello sfondo in un ritratto o lo sfondo di una foto. Selezionando l’area e indicando i colori desiderati nel prompt di modifica testuale. In questo modo è possibile ottenere l’immagine con lo sfondo che si preferisce.

6. Cambiare la posizione di un oggetto

DALL-E 3 consente anche di modificare la posizione di oggetti specifici all’interno dell’immagine. Questo può essere utile ad esempio per ritoccare la composizione di un ritratto o una scena. Ad esempio, si può prima generare l’immagine di un lago, con un isolotto al centro, poi si può chiedere all’AI di spostare l’isola più indietro.

DALL-E è in grado di eseguire la modifica spostando l’isola. In generale, bisogna indicare chiaramente dove e quanto si vuole spostare un oggetto. Se lo spazio nell’immagine è limitato, può essere necessario generare una nuova versione con una composizione più adatta alle modifiche richieste.

7. Aggiungere riflessi

DALL-E 3 permette di aggiungere o modificare i riflessi nelle immagini. Ad esempio, se si vuole aggiungere dei riflessi sull’acqua di un lago, dopo aver generato l’immagine iniziale è possibile selezionare la zona del lago e inserire una richiesta come “Aggiungi riflessi realistici sulla superficie dell’acqua“.

DALL-E 3 aggiornerà l’immagine inserendo i riflessi richiesti. Bisogna però fare attenzione perché a volte, modificando alcuni elementi, l’AI potrebbe cambiare completamente prospettiva e composizione. Quindi può essere necessario fare diversi tentativi specificando con precisione dove si vogliono i riflessi e come dovrebbero apparire, ad esempio: “Mantenendo la stessa prospettiva, aggiungi riflessi realistici solo sulla parte inferiore del lago“. Come sempre, maggiori sono i dettagli nel prompt, migliore sarà il risultato.

8. Rendere più nitide alcune parti dell’immagine

La qualità delle immagini generate dall’AI a volte può non essere ottimale, con alcune zone dell’immagine che appaiono sgranate o sfocate. In questi casi è possibile migliorare la nitidezza di aree specifiche dell’immagine utilizzando la funzione di editing testuale.

Ad esempio, se si nota che un edificio sullo sfondo appare poco definito, è possibile selezionare quella zona e inserire nel prompt una richiesta come “Rendi l’edificio sullo sfondo più nitido e definito“. DALL-E 3 elaborerà di nuovo l’immagine, migliorando la nitidezza della zona indicata.

9. Aggiungere nuovi soggetti

Con DALL-E 3 è possibile modificare le immagini generate aggiungendo nuovi soggetti come persone o animali. Ad esempio, se si vuole aggiungere un cane ad una scena di famiglia, dopo aver ottenuto l’immagine iniziale è possibile selezionare la zona dove si desidera far apparire il cane e inserire nel prompt testuale una richiesta tipo: “Aggiungi un golden retriever seduto sul pavimento con sguardo felice in basso a destra.”

DALL-E 3 genererà una nuova versione dell’immagine con il cane nella posizione specificata. Se la prima modifica altera troppo la scena originale, si può provare a selezionare nuovamente la zona desiderata e ripetere la richiesta testuale finché non si ottiene il risultato sperato.

Annulla

Stai citando questo messaggio:

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicata. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy.
Pubblicando questo commento dai il consenso affinché un cookie salvi i tuoi dati (nome, email, sito web) per il prossimo commento.

Iscrivimi alla newsletter gratuita di Punto Informatico Tutte le mattine direttamente nella tua casella email tutte le novità del mondo digitale e tech

Grazie, il tuo commento è in fase di approvazione

Grazie, il tuo commento è stato pubblicato

Commento non inviato

Grazie per esserti iscritto alla nostra newsletter

Oops, la registrazione alla newsletter non è andata a buon fine. Riprova.

Leggi gli altri commenti

Tiziana Foglio

Pubblicato il 9 giu 2024

Link copiato negli appunti

Ti potrebbe interessare