Il modello di intelligenza artificiale generativa di tipo text-to-image messo a punto da Stability AI, già al centro dell’attenzione anche in relazione al fenomeno deepfake, compie un passo in avanti con l’annuncio di SDXL 0.9. Stando a quanto reso noto dai responsabili dell’iniziativa, a migliorare sono la composizione e la qualità generale delle immagini prodotte. L’accesso può essere effettuato fin da subito attraverso ClipDrop, presto arriverà l’API.
SDXL 0.9: la nuova IA generativa di Stability AI
I progressi sono legati in primis al numero di parametri tenuti in considerazione durante la fase di addestramento, ritenuto superiore rispetto a quello di qualsiasi altro progetto dalla natura open source di questo ambito, nonché all’approccio strutturato in più fasi. Tutti i dettagli saranno riportati in una documentazione che verrà pubblicata a breve.
Nell’immagine qui sotto è possibile apprezzare la differenza tra i risultati ottenuti con SDXL Beta rilasciato in aprile (a sinistra) e con il nuovo SDXL 0.9 (a destra). Il prompt sottoposto all’IA è aliens walk among us in Las Vegas, scratchy found film photograph
.
Questo, invece, il nostro test: l’input è an elephant with a little mouse on a bike on its back, on a purple flying carpet passing over a field with red apple trees
.
In merito ai requisiti necessari per l’utilizzo di SDXL 0.9, ecco quanto specificato da Stability AI.
Nonostante il suo potente output e l’architettura avanzata del modello, SDXL 0.9 può girare su GPU consumer moderne, richiedendo solo un sistema operativo Windows 10 o 11 oppure Linux, con 16 GB di RAM, una scheda video NVIDIA GeForce RTX 20 (equivalente o standard superiore) equipaggiata con un minimo di 8 GB di VRAM. Gli utenti Linux sono inoltre in grado di utilizzare una scheda AMD compatibile con 16 GB di VRAM.
La disponibilità è pubblica (il codice si trova su GitHub), gli impieghi consentiti sono quelli relativi all’ambito della ricerca. Per metterne subito alla prova le potenzialità è possibile inserire un prompt su ClipDrop, come scritto in apertura. Il team al lavoro sul progetto ha già anticipato che intorno a metà luglio sarà rilasciata la versione 1.0.