Dopo appena due mesi di anteprima, Stability AI ha annunciato il rilascio ufficiale di Stable Diffusion 3, il suo ultimo modello per la generazioni di immagini, insieme all’anteprima di “Stable Assistant“, una nuova tecnologia di chatbot.
Stable Diffusion 3 è accessibile tramite API sulla piattaforma per sviluppatori di Stability AI. Questo permetterà l’integrazione delle capacità di generazione di text-to-image offerte dal modello in una vasta gamma di servizi e applicazioni. Oltre al modello base, viene lanciato anche Stable Diffusion 3 Turbo, una versione ancora più veloce e performante.
Il modello open source è in arrivo
Sebbene al momento Stable Diffusion 3 sia disponibile solo via API, Stability AI ha confermato che il modello open source è in dirittura d’arrivo. L’azienda sta lavorando per ottimizzarlo ulteriormente prima del rilascio pubblico.
Grazie ad una collaborazione strategica tra Stability AI e Fireworks AI, leader nelle piattaforme API, l’API di Stable Diffusion 3 potrà contare sull’esperienza di Fireworks AI nell’ottimizzazione delle prestazioni su larga scala. Questo aspetto è fondamentale per garantire l’efficienza del modello nelle applicazioni di intelligenza artificiale. La partnership permetterà a Stable Diffusion 3 di sfruttare al massimo le potenzialità dell’infrastruttura di Fireworks AI, migliorando le performance di inferenza dell’API a beneficio degli utenti.
SD3-Turbo e l’innovativa tecnica LADD
Il modello Stable Diffusion Turbo (SD3-Turbo) si distingue per la sua velocità, fino a 10 volte superiore rispetto a SD3, pur generando immagini di qualità quasi equivalente. Il segreto sta nella Latent Adversarial Diffusion Distillation (LADD), una tecnica innovativa descritta nel documento di ricerca su SD3-Turbo.
Inoltre, l’architettura Multimodal Diffusion Transformer (MMDiT) introduce per la prima volta un trasformatore in Stable Diffusion, migliorando notevolmente la comprensione del testo e l’accuratezza tipografica.
Stable Assistant: il futuro è multimodale
Ma le sorprese non finiscono qui. Stability AI ha fornito anche un’anteprima beta di Stable Assistant, un chatbot alimentato dalla tecnologia di generazione di testo e immagini dell’azienda. Integrando Stable Diffusion 3 e Stable LM 2 12B, Stable Assistant permetterà agli utenti di generare immagini dalle conversazioni, ottenere risposte, ricevere assistenza per progetti di scrittura e arricchire i contenuti con immagini pertinenti.
“Stable Assistant vuole essere il chatbot multimodale di Stability AI, rendendo accessibili a tutti i nostri modelli e servizi API senza richiedere competenze tecniche“, ha spiegato Laforte. “Intendiamo continuare a svilupparne le capacità, aggiungendo presto l’editing delle immagini e includendo modelli per altre modalità come video, 3D, audio e codice.“