Google Gemini genera di nuovo le immagini di persone

Google Gemini genera di nuovo le immagini di persone

Gemini permetterà nuovamente di generare immagini di persone con il recente modello Imagen 3, ma solo agli abbonati con input in inglese.
Google Gemini genera di nuovo le immagini di persone
Gemini permetterà nuovamente di generare immagini di persone con il recente modello Imagen 3, ma solo agli abbonati con input in inglese.

Google ha annunciato che Gemini permetterà nuovamente di generare le immagini di persone nei prossimi giorni. La funzionalità era stata rimossa oltre sei mesi fa, in quanto i risultati ottenuti erano piuttosto discutibili (per usare un eufemismo). L’azienda di Mountain View ha inoltre comunicato l’imminente arrivo dei chatbot personalizzati (Gems) per gli abbonati.

Immagini di persone con Imagen 3

La generazione delle immagini di persone era disponibile dall’inizio di febbraio. Diversi utenti hanno scoperto che il modello Imagen 2 non interpretava correttamente gli input testuali, fornendo risultati storicamente sbagliati (ad esempio, nazisti di pelle nera). Google ha sospeso la funzionalità, spiegando il motivo per cui venivano create immagini errate. Il ripristino della funzionalità avverrà nei prossimi giorni (in ritardo rispetto alle previsioni).

La generazione delle immagini di persone sfrutterà il nuovo modello Imagen 3. Google sottolinea che la qualità delle immagini è superiore a quella dei modelli concorrenti. Ad ogni immagine verrà aggiunto il watermark SynthID che indica l’uso dell’intelligenza artificiale.

Imagen 3 non permette di creare immagini fotorealistiche di persone reali e minori, né immagini violente e sessualmente esplicite. La funzionalità sarà inizialmente disponibile agli abbonati Gemini Advanced, Enterprise e Business (solo in inglese).

Chatbot custom per gli abbonati

Google ha annunciato anche l’arrivo di Gems per gli abbonati Gemini Advanced, Enterprise e Business su desktop e mobile in oltre 150 paesi. Gli utenti potranno creare chatbot personalizzati che sono esperti su determinati argomenti. L’azienda di Mountain View offre cinque Gem predefiniti che possono rispondere a specifiche domande.

Per quanto riguarda gli LLM (Large Language Model) è disponibile una variante di Gemini 1.5 Flash con 8 miliardi di parametri. Google ha inoltre migliorato Gemini 1.5 Flash e Gemini 1.5 Pro. Quest’ultimo occupa ora la seconda posizione nella classifica Chatbot Arena.

Fonte: Google
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
29 ago 2024
Link copiato negli appunti