ChatGPT, arriva la generazione di immagini con GPT-4o

ChatGPT, arriva la generazione di immagini con GPT-4o

OpenAI integra in ChatGPT la generazione di immagini tramite GPT-4o, per creare immagini più accurate, con una resa migliore dei testi.
ChatGPT, arriva la generazione di immagini con GPT-4o
OpenAI integra in ChatGPT la generazione di immagini tramite GPT-4o, per creare immagini più accurate, con una resa migliore dei testi.

ChatGPT ha appena fatto un salto di qualità clamoroso! Sam Altman ha annunciato in pompa magna il primo grande aggiornamento alle capacità di generazione di immagini del chatbot, dopo oltre un anno di stallo.

Il segreto di questo upgrade è GPT-4o, il modello che da tempo fa girare ChatGPT, ma che finora si limitava a generare e modificare solo testo. Ora, invece, GPT-4o può creare e ritoccare immagini e foto in modo nativo, senza bisogno di passare per altri strumenti.

GPT-4o può generare e ritoccare imma<gini nativamente

La nuova funzione è già disponibile per gli abbonati al piano Pro da 200 dollari al mese. Gli utenti possono utilizzarla sia su ChatGPT che su Sora, il generatore di video AI. Ma OpenAI ha promesso che presto arriverà anche per gli utenti Plus, per quelli gratuiti e persino per gli sviluppatori che usano il servizio API.

GPT-4o non solo sostituisce di fatto DALL-E 3, il precedente modello di generazione di immagini, ma promette di fare le cose con più calma e precisione. Tradotto: immagini più accurate e dettagliate. E non solo: GPT-4o sa anche modificare immagini esistenti, trasformandole o aggiungendo dettagli in primo piano e sullo sfondo. Sì, anche se includono persone.

Addestramento nel rispetto degli artisti

Ma come ha fatto OpenAI a rendere GPT-4o così bravo? Semplice: l’ha addestrato con “dati pubblicamente disponibili” e con dati proprietari ottenuti grazie alle partnership con aziende come Shutterstock. Peccato che i dettagli sul training siano top secret.

Brad Lightcap, il capo operativo di OpenAI, ha assicurato al Wall Street Journal che l’azienda rispetta i diritti degli artisti e ha delle policy per evitare di imitare direttamente il lavoro di artisti viventi. C’è anche un modulo per chiedere la rimozione delle proprie opere dai dataset di addestramento.

ChatGPT non è l’unico a volersi cimentare con le immagini generate nativamente. Anche Google ci ha provato con Gemini 2.0 Flash, ma l’esperimento è andato virale per i motivi sbagliati: permetteva di rimuovere il watermark e di generare immagini di personaggi celebri e altro materiale coperto da copyright.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
26 mar 2025
Link copiato negli appunti