Si chiama Stable Video 3D (SV3D) ed è il nuovo modello di intelligenza artificiale generativa di tipo image-to-video annunciato da Stability AI. Come si può intuire dal nome, è dedicato ai contenuti video. In particolare, permette di creare filmati in tre dimensioni partendo da una singola immagine fornita come input.
Stability AI annuncia il modello Stable Video 3D
Si basa sulla stessa tecnologia già vista in azione con Stable Video Diffusion, annunciato nel novembre scorso, ed è un’evoluzione di Stable Zero123 svelato a dicembre. Per gli addetti ai lavori, la disponibilità è al momento limitata agli utilizzi commerciali, come parte del pacchetto accessibile con l’abbonamento Professional Membership dal costo mensile di 20 dollari. Tutti gli altri possono far riferimento alla pagina dedicata su Hugging Face.
SV3D è in grado di generare video composti da 21 fotogrammi con una risoluzione pari a 576×576 pixel. Stando a quanto si legge nel repository GitHub del progetto, funziona al meglio quando riceve in input un’immagine con le stesse dimensioni, contenente un solo oggetto e con uno sfondo bianco uniforme.
La redazione di VentureBeat ha sottoposto il modello a un primo test: qui sotto il risultato ottenuto. Al netto di alcune distorsioni che un occhio attento può notare, la qualità sembra elevata e il rendering, sia del soggetto inquadrato sia degli oggetti che lo circondano, è coerente durante la rotazione del punto di osservazione.
A chi è destinato Stable Video 3D? Come afferma la stessa Stability AI, ai creatori interessati alla generazione di asset 3D mediante l’intelligenza artificiale, in particolare a coloro attivi negli ambiti del gaming e dell’e-commerce, in quest’ultimo caso per offrire ai clienti esperienze di shopping più coinvolgenti.
Sono disponibili due varianti: SV3D_u per generare video orbitali basati su una singola immagine senza condizionamento della videocamera e SV3D_p in grado di considerare il percorso da far eseguire al punto di osservazione.