Stability AI ha appena presentato l’aggiornamento Stable Video Diffusion 1.1 (SVD 1.1). SVD 1.1 è una versione ottimizzata di SVD 1.0 per generare brevi video AI con movimenti più fluidi e una maggiore coerenza. Come annunciato da Tom Mason, CTO di Stability AI, il nuovo modello è disponibile pubblicamente e può essere scaricato da Hugging Face. L’uso commerciale richiede un abbonamento a pagamento, mentre resta gratuito per scopi di ricerca.
A novembre 2023 Stability AI ha lanciato due modelli chiamati SVD e SVD-XT, che permettono di creare video di quattro secondi partendo da un’immagine fissa. Ora, L’aggiornamento del suo modello, chiamato appunto SVD 1.1, promette di migliorare la qualità e la coerenza dei video generati.
Come funziona SVD 1.1
SVD 1.1 funziona in modo simile ai modelli precedenti, ma con alcune differenze. Innanzitutto, consente di creare video a una risoluzione più alta, di 1024×576 pixel, con un fotogramma di contesto della stessa dimensione. Inoltre, produce 25 fotogrammi per video, invece dei 14 del modello base o dei 25 del modello perfezionato.
Ma la novità più importante è che SVD 1.1 dovrebbe offrire risultati video più coerenti rispetto al modello originale. Questo significa che i video generati dovrebbero essere più realistici, con un movimento più fluido e naturale, e senza artefatti o errori. In particolare, dovrebbe essere in grado di generare volti e persone in modo più soddisfacente, evitando le distorsioni o le anomalie che si verificavano spesso con i modelli precedenti.
Come usare SVD 1.1
SVD 1.1 è disponibile sulla piattaforma Hugging Face, dove si possono trovare anche i modelli precedenti. Basta inserire un’immagine fissa per ottenere il video generato. Si può anche scegliere la risoluzione e il layout del video, tra cui 1024×576, 768×768 e 576×1024.
SVD 1.1 è anche disponibile tramite le API di Stability AI, che permettono di generare video in formato MP4, con 25 fotogrammi generati e i restanti fotogrammi interpolati. Le API supportano anche il controllo della forza del movimento e diversi layout e risoluzioni.
Il contesto e la concorrenza di Stability AI
Stability AI è una delle aziende più innovative nel campo della generazione di video con l’intelligenza artificiale. Fondata nel 2019, ha raccolto finanziamenti significativi, tra cui un round da 101 milioni di dollari annunciato nel 2022. Nel 2023, ha lanciato diversi modelli di generazione di video, tra cui SVD e SVD-XT, che hanno attirato l’attenzione e l’interesse degli utenti e degli sviluppatori. Anche il 2024 sembra essere un anno ricco di novità per Stability AI, che ha presentato SVD 1.1 come il suo primo aggiornamento.
Tuttavia, Stability AI non è l’unica azienda a operare in questo settore. Ci sono anche altri concorrenti, come Runway e Pika, che offrono piattaforme web per generare e modificare video con l’AI. Queste piattaforme sono rivolte ai clienti che non hanno bisogno di API, ma vogliono solo creare video per divertimento o per scopi creativi.
Runway e Pika offrono anche funzionalità aggiuntive, come la possibilità di aggiungere movimento a parti specifiche dei video o di scambiare il volto di un soggetto con un altro. Tuttavia, queste piattaforme non offrono ancora i loro modelli tramite API, il che limita le possibilità di integrazione con altre applicazioni.