Stability AI ha appena annunciato il lancio di Stable Diffusion 3 (SD3), il suo modello più avanzato e potente per la generazione di immagini realistiche e di alta qualità. Il modello è il risultato di anni di ricerca e sviluppo, e mira a competere con le soluzioni proposte da OpenAI e Google, due giganti del settore.
Caratteristiche e funzionalità di SD3
SD3 si basa su una nuova architettura e sarà compatibile con diversi tipi di hardware, anche se richiede comunque delle prestazioni elevate. Il modello non è ancora disponibile al pubblico, ma è possibile iscriversi a una lista d’attesa per accedere a una versione di anteprima.
SD3 sfrutta un “trasformatore di diffusione” migliorato, una tecnica innovativa che permette di generare immagini partendo da un rumore casuale e applicando delle trasformazioni progressive. Questa tecnica è stata introdotta nel 2022 e perfezionata nel 2023, raggiungendo livelli di scalabilità e qualità mai visti prima. Un esempio di applicazione di questa tecnica è Sora, il sorprendente generatore di video di OpenAI, che condivide lo stesso coautore dell’articolo originale sul trasformatore di diffusione, Will Peebles.
SD3 utilizza anche il “flow matching”, un altro metodo che ottimizza la qualità delle immagini senza aumentare troppo la complessità del modello.
SD3: un modello di AI generativa per tutti
Stability AI vuole rendere SD3 accessibile e utilizzabile da chiunque abbia bisogno di generare immagini per scopi diversi, sia professionali che personali. A differenza di altre soluzioni basate su API, che richiedono una connessione a internet e un pagamento per l’uso, SD3 sarà scaricabile e installabile sul proprio dispositivo, garantendo maggiore flessibilità e autonomia. Per facilitare l’uso di Stable diffusion 3, l’azienda sta anche lavorando a dei nuovi strumenti che saranno rivelati in seguito.
La sicurezza al primo posto
Stability AI è consapevole dei potenziali rischi e abusi che possono derivare dall’uso di un modello di AI generativa così potente e realistico. Per questo motivo, l’azienda ha adottato e continuerà ad adottare delle misure di sicurezza adeguate, che coprono tutto il ciclo di vita del modello, dalla fase di addestramento a quella di distribuzione. Tra queste misure, ci sono dei controlli di qualità, delle valutazioni etiche e delle collaborazioni con esperti e ricercatori del campo. L’azienda si impegna a innovare con integrità e responsabilità, e a rispettare le normative vigenti in materia di privacy e proprietà intellettuale.
Cosa aspettarsi da SD3
SD3 promette di essere un modello di AI generativa rivoluzionario, in grado di creare immagini di qualunque soggetto, stile e formato, con un livello di dettaglio e realismo impressionante. Il modello sarà presentato in anteprima a breve, e poi rilasciato al pubblico in una data ancora da definire. Nel frattempo, è possibile approfondire gli aspetti tecnici e teorici che stanno alla base di SD3, consultando gli articoli e i documenti pubblicati dall’azienda e dai suoi collaboratori.
SD3 è composto da una suite di modelli che variano da 800 milioni a 8 miliardi di parametri, superando le dimensioni del precedente SD XL. Il modello è in grado di gestire la multimodalità, cioè la combinazione di diverse modalità di input e output, come il testo, l’audio e il video.
Inoltre, è in grado di inserire e generare video, una funzionalità che lo distingue dai suoi concorrenti basati su API. Queste capacità sono ancora in fase di sviluppo, ma non sembrano presentare ostacoli insormontabili. Su X, la piattaforma di social media fondata dall’ex CEO di Twitter, Emad Mostaque, il capo di Stability AI, ha mostrato alcuni esempi di ciò che SD3 può fare, suscitando l’ammirazione e la curiosità degli utenti.