Insieme a Gemini Pro, l’azienda di Mountain ha annunciato la disponibilità di Imagen 2 in Vertex AI su Google Cloud. I clienti potranno sfruttare il modello per creare immagini fotorealistiche. MedLM è invece il nuovo modello di IA generativa per il settore sanitario. In entrambi i casi, l’accesso richiede l’iscrizione alla lista di attesa e la successiva approvazione.
Imagen 2 in Vertex AI
Imagen 2, sviluppato da Google DeepMind, è il modello text-to-image più avanzato dell’azienda californiana. I clienti possono scegliere il modello nella piattaforma Vertex AI (concorrente di Amazon Bedrock) e generare immagini fotorealistiche in alta risoluzione tramite una descrizione (prompt) testuale. Rispetto alla prima generazione ci sono notevoli miglioramenti, ma Google non ha svelato quali dati sono stati utilizzati per l’addestramento del modello (uno degli obblighi previsti dall’AI Act in Europa).
Uno dei difetti dei modelli text-to-image è relativo al rendering del testo. Imagen 2 può generare immagini sulle quali è presente una parola o frase corretta (utile per le campagne pubblicitarie). Questi sono due esempi:
Imagen 2 può inoltre generare loghi realistici per aziende, brand e prodotti che possono essere sovrapposti a immagini esistenti. Il modello può anche creare didascalie dettagliate e rispondere a domande sugli elementi nell’immagine. Le lingue supportate sono inglese, cinese, hindi, giapponese, coreano, portoghese e spagnolo. Sulle immagini generate viene applicato il watermark invisibile SynthID sviluppato da Google DeepMind.
MedLM in Vertex AI
MedLM è invece il nuovo modello di IA generativa per il settore sanitario. È attualmente basato su Med-PaLM 2, ma nei prossimi mesi verrà usato Gemini. Può essere sfruttato per eseguire diverse attività, dalla creazione di riassunti delle conversazioni alla ricerca di farmaci e trattamenti medici. È accessibile sono ai clienti Google Cloud negli Stati Uniti.