Big G continua a migliorare i suoi modelli AI e recentemente, ha aggiunto una nuova funzione a Google Gemini 2.0. Se si utilizza il servizio sul proprio computer in Google AI Studio, ora è possibile non solo generare immagini, ma anche modificarle. Photoshop deve iniziare a preoccuparsi? Forse…
Esistono molti strumenti AI per la generazione di immagini: Midjourney, Ideogram, Microsoft Designer, ecc. Ma alcuni sono costosi, altri sono molto limitati e si possono generare solo poche immagini al giorno. È quindi positivo che Google abbia lanciato una versione sperimentale di Gemini 2.0 Flash come parte del suo Google AI Studio. Permette di creare immagini gratuitamente e senza limiti (“solo”, si fa per dire, 1.000 modifiche al giorno).
Ciò che distingue Gemini 2.0 Flash è la sua capacità di combinare comprensione del testo, ragionamento avanzato ed elaborazione multimodale. È davvero impressionante perché riesce a capire sia testi che immagini e a metterli insieme in modo sensato. Inoltre, mantiene coerenti i personaggi nelle storie visive, finalmente niente più protagonisti che cambiano faccia tra un’immagine e l’altra… E poi permette di modificare un dettaglio, senza stravolgere tutto il resto.
Ma c’è un problema serio: molti utenti hanno iniziato a usare Gemini 2.0 Flash per rimuovere il watermark dalle immagini. Per il momento Google non ha dato spiegazioni, ma essendo un modello sperimentale, ci sta che non sia infallibile.
Come creare e modificare le immagini con Gemini 2.0 Flash in Google AI Studio
Per chi non conoscesse Google AI Studio, è una piattaforma web sviluppata da Big G, che permette di interagire con i suoi modelli linguistici di grandi dimensioni (LLM), tra cui Gemini, appunto. È una sorta di cassetta degli attrezzi per chi vuole cimentarsi con l’intelligenza artificiale in modo semplice e intuitivo. All’interno dell’interfaccia, accessibile direttamente dal browser, basta selezionare l’opzione “Crea prompt” nel menu laterale per accedere a un ambiente chiaro e facile da usare. Al centro della schermata c’è una barra di testo in cui inserire il prompt. Fin qui, tutto bene.
Google AI Studio offre molte altre possibilità, ma oggi ci concentreremo sull’editing delle immagini. Per farlo, è importante utilizzare la versione giusta di Gemini. Se si va sul sito di Gemini, non funziona. È un po’ complicato se non si conosce la procedura. Ecco come sfruttare questa funzione per generare e modificare le immagini.
- Nel browser del computer (non funziona ancora sugli smartphone), lanciare Google AI Studio dal menu;
- Selezionare il modello Gemini 2.0 Flash (Image Generation) Experimental a destra, sotto la voce “Model”;
- Subito sotto, alla voce “Output Format”, è necessario assicurarsi che sia selezionato Images and text, altrimenti non sarà possibile modificare le immagini;
- In basso, nella riga di input, è possibile formulare una richiesta per generare un’immagine;
- È possibile anche cliccare sul simbolo “+” a destra nella riga di immissione e caricare le proprie immagini;
- Da qui, tutto ciò che si deve fare è essere creativi e modificare un’immagine esistente. Si può cambiare la posa delle persone, vestirle in modo diverso, aggiungere sfondi alle immagini e molto altro ancora!
Cosa si può fare con Gemini 2.0 Flash?
Quando ci si trova nella pagina vuota di Google AI Studio, si vedranno tre esempi di opzioni di modifica al centro. Si tratta di “Image editing”, “Visual story” e “Birthday card”. Facendo clic su questi tre esempi, si ottiene una dimostrazione molto chiara di ciò che lo strumento può fare. Logicamente, è possibile modificare un’immagine in “Image editing”. L’esempio di Google mostra una prima immagine di partenza, dei croissant, e poi l’immagine modificata, con un tocco di cioccolato, aggiunto con un semplice prompt testuale (Add some chocolate drizzle to the croissants.“).
Ma gli altri esempi offerti da Google sono altrettanto impressionanti. Ad esempio, se si clicca su “Visual story”, Gemini inventerà una storia in pochi minuti, con tanto di immagini appropriate a corredo. La cosa bella è che le immagini sono coerenti! Ciò significa che se nella storia compare una dolce pecorella, sarà sempre la stessa in tutte le illustrazioni, senza cambiamenti improvvisi di stile o aspetto.
Un’altra funzione interessante è “Birthday Card”, che permette di creare un biglietto d’auguri personalizzato e ben curato graficamente. Questo dimostra che Google AI Studio non si limita al solo testo, ma potrebbe addirittura competere con strumenti di design visivo come Canva.
Questo nuovo modo di modificare le immagini potrebbe rappresentare una minaccia ancora più grande per programmi come Adobe Photoshop. Bisogna riconoscere che applicare modifiche complesse, come aggiungere una giacca di pelle a qualcuno che indossa solo una maglietta, richiede tempo e competenze specifiche. Con questo strumento AI, invece, tutto diventa incredibilmente più semplice.
Gemini 2.0 Flash lancia il guanto di sfida a Photoshop e Canva
Ciò che colpisce è la facilità con cui il Gemini 2.0 Flash riesce a mantenere una certa coerenza visiva tra le modifiche, rendendo le trasformazioni naturali e realistiche. Certo, non sempre il risultato è perfetto, ma bisogna considerare che si tratta ancora di una versione sperimentale dello strumento, quindi qualche imprecisione è più che comprensibile.
Provando questa funzione, si può avere un assaggio del suo potenziale. Ma la vera domanda non è solo cosa significhi per l’utente, bensì quali conseguenze potrebbe avere su strumenti affermati come Photoshop e Canva. Con Gemini 2.0 Flash, operazioni che solitamente richiedono tempo, competenze e risorse – come la creazione di inviti per feste, illustrazioni per un blog di ricette o il design di prodotti per un negozio online – diventano accessibili con pochi clic e in un istante.
Ovviamente, trattandosi ancora di una versione sperimentale, ci sono margini di miglioramento. A volte, alcuni elementi indesiderati possono riapparire in immagini successive, e in alcuni casi la coerenza visiva tra le modifiche non è perfetta. Tuttavia, con un po’ di sperimentazione, si possono ottenere risultati sorprendenti. Resta il fatto che è incredibile vedere tutto ciò che già oggi è possibile fare, gratuitamente, con uno strumento AI.