Stability AI ha appena annunciato il rilascio della sua ultima famiglia di modelli di immagini AI, Stable Diffusion 3.5. Rispetto alla precedente versione, Stable Diffusion 3, la nuova famiglia permette di ottenere risultati più realistici e dettagliati. In particolare, sono state perfezionate la resa immediata del testo in immagine e l’aderenza ai prompt testuali forniti dall’utente.
La famiglia Stable Diffusion 3.5 è disponibile in tre dimensioni: Large (8B), Large Turbo (8B) e Medium (2,6B), tutte personalizzabili e ottimizzate per funzionare su hardware consumer, oltre a essere accessibili attraverso la Stability AI Community License.
Stable Diffusion 3.5, il nuovo modello di StabilityAI
L’azienda ha riconosciuto che il modello Stable Diffusion 3 Medium, lanciato a giugno, non aveva pienamente soddisfatto gli standard interni e le aspettative della comunità. Tuttavia, invece di optare per una soluzione rapida, il team di StabilityAI ha dedicato tempo ed energie per sviluppare ulteriormente una versione che potesse davvero eguagliare e potenzialmente superare le capacità del recente Flux 1.1 Pro.
Personalizzazione, efficienza e varietà: gli ingredienti di Stable Diffusione 3.5
I modelli inclusi in Stable Diffusion 3.5 si concentrano sulla personalizzazione, sull’efficienza delle prestazioni e sulla varietà dei risultati. Ciò significa che le immagini possono essere messe a punto con precisione, i modelli funzionano su hardware di consumo senza necessità di configurazioni aggiuntive e le immagini generate saranno più uniche e diversificate tra loro.
Inoltre, è stata posta particolare attenzione alle nuove scelte stilistiche, tra cui la fotografia, la pittura e altro ancora. Il sistema è in grado di accettare richieste di hashtag per specificare uno stile particolare, come boho o fashion, e può utilizzare l’evidenziazione all’interno del prompt per indirizzare il modello verso una direzione specifica.
Licenze flessibili
Secondo l’analisi condotta da Stability AI, Stable Diffusion 3.5 Large si posiziona al vertice del mercato per quanto riguarda l’aderenza ai prompt e rivaleggia con modelli molto più grandi in termini di qualità delle immagini. Stable Diffusion 3.5 Turbo, invece, offre tempi di inferenza tra i più rapidi per le sue dimensioni, rimanendo altamente competitivo sia per la qualità dell’immagine che per l’aderenza immediata, anche se confrontato con modelli non distillati di dimensioni simili. Infine, Stable Diffusion 3.5 Medium supera gli altri modelli di medie dimensioni, offrendo un equilibrio tra aderenza immediata e qualità dell’immagine che lo rende la scelta migliore per prestazioni efficienti e di alta qualità.
Il modello è gratuito per uso non commerciale, compresa la ricerca scientifica, e per le piccole e medie imprese fino a 1 milione di dollari di fatturato. Per qualsiasi altro utilizzo è necessaria una licenza Enterprise.