L’intelligenza artificiale ha cambiato, per non dire stravolto, la creazione dei contenuti. E non stiamo parlando solo di scrittura. Gli strumenti AI di oggi sono in grado di fare di tutto, dalla stesura di post per blog alla generazione di splendide opere d’arte in vari stili.
Chi ama la fotografia e l’arte o le utilizza nel proprio lavoro, probabilmente conosce già i generatore di arte AI. Uno degli strumenti più in voga è DALL-E, un generatore di immagini text-to-image di OpenAI, la stessa azienda che ha creato ChatGPT. Pur essendo uno strumento di tendenza, DALL-E non è l’unico generatore di immagini AI in circolazione.
Che cos’è DALL-E?
DALL-E è un generatore d’arte AI che, a partire da una semplice descrizione testuale dell’immagine che si ha in mente (il cosiddetto “prompt”), è in grado di produrre una foto realistica, un disegno, una grafica o un’illustrazione. Rilasciato da OpenAI nel 2021, al momento in cui scriviamo, utilizza la tecnologia GPT-4, l’ultimo modello di ChatGPT.
Piccola curiosità: il nome DALL-E fa riferimento al celebre pittore surrealista Salvador Dalì e al noto robot animato Wall-E della Disney Pixar. È stato scelto per rappresentare la fusione tra tecnologia e arte, tra intelligenza artificiale e creatività umana.
DALL-E è una rete neurale che utilizza l’elaborazione del linguaggio naturale (NLP) e i grandi modelli linguistici (LLM). Rispetto al precedente DALL-E 2, questa versione è più potente e veloce, grazie all’architettura GLIDE 3.5 su cui si basa. Può generare immagini di qualità ancora maggiore, con risoluzioni fino a 1024×1024 pixel.
Inoltre, DALL-E 3 presenta miglioramenti nella manipolazione delle immagini, come la possibilità di modificare attributi specifici oppure combinare elementi di immagini diverse. La comprensione del linguaggio naturale è stata perfezionata, permettendo di inserire prompt sempre più articolati per ottenere i risultati desiderati. Infine, la generazione delle immagini è fino a 4 volte più veloce.
Cosa cercare nelle alternative a DALL-E?
Anche se DALL-E è uno dei più famosi generatori di immagini AI, non è l’unica opzione. Esistono molti altri strumenti che potrebbero essere più adatti alle proprie esigenze. Gli aspetti a cui prestare attenzione, sono:
- Interfaccia user-friendly: è importante scegliere uno strumento di facile utilizzo, sia per esperti che per principianti nella creazione di immagini IA.
- Funzionalità di modifica: anche se lo strumento può creare un’immagine di qualità, sono da preferire funzioni di editing per apportare modifiche e miglioramenti al design.
- Prompt personalizzabili: nella creazione di prompt testuali, è utile la possibilità di aggiungere parametri per ottenere esattamente ciò che si desidera.
- Generazione rapida: è preferibile uno strumento che elabori la richiesta testuale e generi l’immagine in pochi secondi, non diversi minuti.
- Diritti d’uso: se si prevede un utilizzo commerciale, è importante verificare i diritti di immagine per evitare problemi legali.
- Varietà di stili: sono da prediligere generatori testo-immagine che permettano di personalizzare temi e stili artistici per immagini realistiche.
Le 5 migliori alternative a DALL-E da utilizzare nel 2024
1. Image Creator di Microsoft Designer (ex Bing Image Creator)
Image Creator di Microsoft Designer si basa su DALL-E 3, il modello di generazione di immagini più avanzato di OpenAI. Di conseguenza, produce gli stessi risultati di qualità di DALL-E, pur rimanendo gratuito rispetto al canone di 20 dollari al mese previsto per l’utilizzo di DALL-E.
Per accedere al generatore di immagini è sufficiente visitare il sito web di Image Creator e accedere con un account Microsoft. Un altro grande vantaggio di questo generatore AI è che è possibile accedervi dallo stesso luogo in cui si accede al chatbot di Microsoft, Copilot (ex Bing Chat).
Ciò significa che, oltre a visitare Image Creator sul suo sito indipendente, è possibile chiedergli di generare immagini direttamente nella chat di Copilot. Questa funzione è molto comoda perché consente di soddisfare gratuitamente tutte le esigenze di generazione di immagini e di chat con l’intelligenza artificiale nello stesso luogo.
Questa combinazione facilita le attività che potrebbero trarre vantaggio dalla generazione di immagini e testi, come ad esempio l’organizzazione di una festa, poiché è possibile chiedere al chatbot di generare temi per la festa e quindi chiedergli di creare immagini che seguano il tema.
2. ImageFX di Google
ImageFX di Google ha esordito molto più tardi rispetto alla concorrenza, oltre un anno dopo il lancio di DALL-E 2, ma le sue prestazioni sembrano essere valse l’attesa. Il generatore di immagini è in grado di produrre risultati realistici e di alta qualità, anche per oggetti difficili da renderizzare, come le mani.
Lo strumento vanta una caratteristica unica, le fiches espressive, che rendono più facile perfezionare le richieste o generarne di nuove tramite le tendine, che evidenziano parti della richiesta e suggeriscono diverse modifiche alle parole per modificare l’output.
ImageFX include anche suggerimenti per lo stile in cui si desidera che l’immagine sia resa, come ad esempio fotorealistico, pellicola da 35 mm, minimale, schizzo, fatto a mano e altro ancora. Questa combinazione di funzioni rende ImageFX perfetto per i principianti che vogliono sperimentare.
3. DreamStudio di Stability AI
Stability AI ha creato il popolarissimo generatore di text-to-image a codice aperto Stable Diffusion. Gli utenti possono scaricare lo strumento e utilizzarlo gratuitamente. Tuttavia, l’utilizzo di questo strumento richiede in genere competenze tecniche.
Per rendere la tecnologia facilmente accessibile a tutti (indipendentemente dal livello di competenza), Stability AI ha lanciato DreamStudio, che incorpora Stable Diffusion in un’interfaccia utente di facile comprensione e utilizzo.
Uno dei punti di forza della piattaforma è che include molte voci diverse per la personalizzazione, tra cui un “prompt negativo” in cui è possibile delineare le specifiche di ciò che si desidera evitare nell’immagine finale. È inoltre possibile modificare facilmente il rapporto dell’immagine, una caratteristica fondamentale, dato che la maggior parte dei generatori di immagini AI fornisce automaticamente un rapporto di 1:1.
4. WOMBO Dream
L’app Wombo Dream si è aggiudicata il primo posto come migliore applicazione in assoluto nei premi 2022 di Google Play e ha cinque stelle sull’App Store di Apple con 141,6 milioni di valutazioni. Con l’app è possibile creare arte e immagini con il semplice inserimento di una rapida richiesta.
Un ulteriore vantaggio è che questo generatore di immagini AI permette di scegliere diversi stili di disegno come realistico, espressionista, fumetto, astratto, fanatico, inchiostro e altro ancora. Oltre all’app, lo strumento dispone di una versione desktop mobile gratuita e semplice da usare. Se si desidera portare l’utilizzo dell’app a un livello superiore, è possibile pagare 90 dollari all’anno o 10 dollari al mese.
5. Firefly di Adobe
Da decenni Adobe è leader nello sviluppo di strumenti creativi per i professionisti della creatività e del lavoro. Di conseguenza, non sorprende che il suo generatore di immagini sia impressionante. Accedere al generatore è facile. Basta visitare il sito web di Firefly e digitare la richiesta dell’immagine che si desidera generare.
Inoltre, le caratteristiche più importanti di questo chatbot sono le funzioni Structure Reference e Style Reference. La funzione di riferimento della struttura (Structure Reference) consente agli utenti di inserire un’immagine da utilizzare come modello per il generatore. Il modello utilizza quindi questa struttura per creare una nuova immagine con lo stesso layout e la stessa composizione. La funzione di riferimento dello stile (Style Reference) utilizza un’immagine come riferimento per generare una nuova immagine con lo stesso stile.
Queste funzioni sono utili se si dispone di un’immagine a cui si desidera che la nuova immagine generata assomigli, ad esempio un rapido schizzo disegnato o anche un logo aziendale o uno stile che si desidera mantenere coerente. Un altro vantaggio è che Adobe Firefly è stato addestrato su immagini Adobe Stock, contenuti con licenza aperta e contenuti di pubblico dominio, rendendo tutte le immagini generate sicure per l’uso commerciale e affrontando il problema etico dei generatori di immagini.
Come scrivere i prompt per generare immagini con l’AI
I prompt, come sappiamo, sono le istruzioni testuali che vengono fornite ai sistemi di intelligenza artificiale generativa di immagini, come DALL-E, per indicare cosa generare. Scrivere prompt efficaci perciò, è cruciale per ottenere i risultati desiderati. Ecco 5 preziosi consigli per sfruttare le potenzialità dei generatori di immagini AI:
- Essere il più specifici possibile nella descrizione di ciò che si vuole generare, includendo dettagli su stile, composizione, colori, ecc. Es: “Un ritratto iperrealista in stile fotografico di una ragazza con i capelli ricci e un vestito blu“.
- Usare parole chiave rilevanti per lo stile o il soggetto che si ha in mente. Es: “un paesaggio fantasy epico in stile fantascientifico“
- Fornire esempi di riferimento e artisti se si vuole emulare uno stile. Es: “Un autoritratto in stile Frida Kahlo con sfondo floreale“.
- Inserire aggettivi descrittivi e avverbi per definire l’aspetto e il mood dell’immagine. Es: “Un cucciolo di cane che dorme beatamente su un cuscino“.
- Evitare frasi generiche o troppo brevi. Maggiori dettagli consentono risultati migliori.
Non resta quindi, che provare e provare, anche per affinare i prompt. Come al solito, la pratica aiuta a migliorare.