Creare prompt specifici per generatori di immagini AI con ChatGPT

Creare prompt specifici per generatori di immagini AI con ChatGPT

Come utilizzare ChatGPT per creare prompt efficaci per i generatori di immagini AI come DALL-E, Midjourney, Nightcafe e DreamStudio AI.
Creare prompt specifici per generatori di immagini AI con ChatGPT
Come utilizzare ChatGPT per creare prompt efficaci per i generatori di immagini AI come DALL-E, Midjourney, Nightcafe e DreamStudio AI.

ChatGPT ha riscosso molto successo sin da quando è stato lanciato. Ha molte applicazioni interessanti, come la creazione di codice, la scrittura di contenuti creativi e informativi. Può essere utile anche per la progettazione di prompt efficaci per i generatori di immagini AI come DALL-E, Midjourney, Nightcafe, e molti altri.

Cosa sono i generatori di immagini/arte AI

I generatori di immagini o di arte AI sono sistemi basati sull’intelligenza artificiale che possono creare immagini a partire da descrizioni testuali, foto, stili o altri input. Si tratta di applicazioni che sfruttano algoritmi di apprendimento profondo per generare immagini realistiche, artistiche, creative o fantasiose, a seconda delle richieste degli utenti.

Dall-E, Midjourney, NightCafe e DreamStudio sono quattro esempi di applicazioni web che utilizzano l’intelligenza artificiale per creare immagini a partire da descrizioni testuali o da stili artistici.

  • Dall-E: sviluppato da OpenAI, è un modello AI avanzato in grado di creare immagini uniche partendo da descrizioni testuali. È noto per la sua abilità nel generare immagini dettagliate e creative, spesso interpretando in modo originale le richieste degli utenti.
  • Midjourney: è un’altra piattaforma di generazione di immagini AI. Si concentra sulla creazione di opere d’arte e design visivi. È utilizzato sia da artisti che da designer per esplorare nuove idee visive e concetti.
  • Nightcafe: è una piattaforma che utilizza l’AI per generare arte e immagini. Offre una varietà di stili e opzioni, permettendo agli utenti di creare opere d’arte digitali in base alle loro specifiche descrizioni o ispirazioni.
  • DreamStudio:  simile agli altri strumenti, utilizza algoritmi di intelligenza artificiale per generare immagini e opere d’arte basate sulle descrizioni degli utenti. È progettato per essere accessibile anche a chi non ha esperienze di grafica o design, rendendo possibile la creazione di immagini complesse senza competenze tecniche particolari.

Cos’è un prompt?

Per sfruttare al meglio le potenzialità dei generatori di arte AI, occorre fornire loro un input adeguato, composto da parole chiave selezionate con cura. Si tratta di un prompt, un testo scritto in linguaggio naturale, che contiene le istruzioni per il sistema di intelligenza artificiale.

Un prompt efficace dovrebbe includere le seguenti informazioni:

  • Soggetto: specifica al sistema quale scena creare. Include un soggetto, cosa sta facendo, dove e come;
  • Caratteristiche: forniscono dettagli aggiuntivi sul soggetto, come aggettivi (meraviglioso, affascinante), descrizione del contesto, ecc.;
  • Tema: suggerisce il genere dell’immagine. Può essere il nome di un artista (Picasso, ecc.) o un tema personalizzato come fantasy, dettagliato, moderno, contemporaneo, ecc.;
  • Motore grafico: stabilisce il tipo di tecnologia grafica che rende l’immagine più realistica. Alcuni esempi di queste parole chiave sono unreal engine, 3D rendering e octane render;
  • Qualità: definisce la qualità dell’immagine, come 4K, 8K o HD.

I diversi generatori AI produrranno risultati diversi, ma la struttura dei prompt è generalmente la stessa.

La lunghezza del prompt

Non esiste una regola fissa sulla lunghezza del prompt, ma in generale si consiglia di usare almeno 3-7 parole per avere immagini più dettagliate e meno astratte. Questo perché l’AI generativa si basa su delle immagini di riferimento che trova su internet, e più parole si usano, più si restringe il campo di ricerca.

Ovviamente, non è necessario seguire sempre questa indicazione, ma se si vuole avere un’immagine più complessa e ricca di dettagli, un prompt di 3-7 parole è una buona scelta. Più il prompt è descrittivo, più l’AI generativa capisce cosa si vuole ottenere.

Il soggetto del prompt

Come per gli artisti umani, anche l’AI generativa ha bisogno di un soggetto da rappresentare. Il soggetto è il protagonista dell’immagine, e può essere una persona, un oggetto o un luogo. Si può usare anche più di un soggetto per prompt.

Il soggetto deve essere espresso con un sostantivo, come per esempio: donna, bicicletta, deserto, fragola, uomo, lattina. L’AI generativa può creare un’immagine a partire da questi sostantivi, ma se si vuole avere un’immagine più specifica e personalizzata, è bene aggiungere dei descrittori.

I descrittori del prompt

I descrittori sono delle parole che aggiungono informazioni sul soggetto, e che aiutano l’IA generativa a creare un’immagine più aderente alle nostre aspettative. I descrittori possono essere verbi o aggettivi che rispondono a domande come:

Cosa sta succedendo? Cosa sta facendo il soggetto? Come sta facendo il soggetto? Cosa c’è intorno al soggetto? Che aspetto ha il soggetto? Per esempio, si può chiedere al generatore AI di creare un’immagine di un cane Jack Russell che legge, utilizzando il seguente prompt: “cane Jack Russell che legge”. L’AI generativa creerà un’immagine semplice e corretta, ma non molto elaborata.

Se invece, si aggiungo dei descrittori, come ad esempio: “cane Jack Russell che legge un libro in una biblioteca”, il generatore sarà in grado di creare un’immagine più complessa e interessante, con più dettagli ed elementi.

Il consiglio è quello di sperimentare con i descrittori per vedere come cambiano i risultati. I descrittori non sono una scienza esatta e possono dare immagini molto diverse tra loro, quindi vale la pena di provarne diversi per vedere quali funzionano meglio. L’uso e il numero dei descrittori dipende dalle preferenze e dalle esigenze personali. Se si vuole un’immagine semplice e veloce di un colibrì, basta scrivere “colibrì” nel prompt. Se si desidera un’immagine più elaborata e originale, basta aggiungere dei descrittori, ad esempio: “colibrì che beve il nettare da un fiore esotico”.

L’aspetto finale dell’immagine

L’ultima parte di un prompt è quella che definisce l’aspetto finale dell’immagine. Si tratta di usare delle parole o delle frasi chiave che indicano lo stile, la prospettiva e l’estetica della composizione. Queste parole possono essere ad esempio “foto”, “pittura a olio” o “scultura 3D”. Si possono anche usare dei termini come “close up”, “wide shot” o “portrait” per specificare il tipo di inquadratura. Si può anche scegliere uno stile artistico e citare degli artisti particolari di cui si vuole che l’AI generativa riproduca il lavoro. Per esempio, si può chiedere di creare un dipinto impressionista nello stile di Vincent Van Gogh di una Batmobile bloccata nel traffico di Los Angeles.

Come usare ChatGPT per creare prompt per i generatori di immagine/arte AI

Se si prende come esempio questo prompt: “Un bellissimo villaggio natalizio, coperto di neve, moderno, unreal engine, 8K”, ci si rende subito conto che i vari generatori di immagini AI producono risultati interessanti, ma privi di personalità.

Per rendere il prompt più ricco e dettagliato, si può sfruttare ChatGPT, il quale può suggerire aggettivi appropriati e descrivere gli elementi di un villaggio natalizio. Per esempio, si potrebbe chiedere al chatbot di elencare aggettivi che si riferiscono al colore, alla forma, alla dimensione o alla sensazione di un villaggio natalizio. Oppure, si potrebbe chiedere di descrivere come sono decorate le case, le strade, le piazze o gli alberi di un villaggio natalizio.

Ecco, come sarà il prompt elaborato con l’aiuto di ChatGPT: “Un villaggio di Natale che sembra uscito da una favola, con ghirlande verdi e rosse che adornano le strade innevate. Gli edifici sono colorati e scintillanti, e trasmettono un’atmosfera affascinante e festosa. Ogni dettaglio è curato e le luci creano un effetto scintillante e magico. L’immagine è un’illustrazione iperrealistica, realizzata con Unreal Engine 5, e ha una risoluzione di 8K“.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
8 dic 2023
Link copiato negli appunti