Non molto tempo fa, era difficile, molto difficile generare immagini 3D. Si trattava di un processo che richiedeva wireframe complessi, software specializzati e hardware “muscolosi”. Oggi non è più così.
Stability AI ha annunciato una nuova tecnologia di intelligenza artificiale generativa, chiamata Stable Fast 3D, che consente di generare immagini 3D a partire da una singola immagine. Ed è anche veloce. Secondo l’azienda, infatti, il nuovo modello può generare un’immagine 3D in mezzo secondo.
Questo straordinario miglioramento della velocità supera di gran lunga i modelli precedenti, come Stable Video 3D (SV3D), che richiedeva fino a 10 minuti per lo stesso compito. Stable Fast 3D svolge lo stesso compito 1200 volte più velocemente!
Applicazioni pratiche di Stable Fast 3D
La velocità e la semplicità di Stable Fast 3D promettono di avere un impatto significativo in numerosi campi, tra cui design, architettura, retail, realtà virtuale e sviluppo di giochi. La facilità con cui è possibile generare risorse 3D di alta qualità consentirà ai professionisti di questi settori di accelerare i loro flussi di lavoro e di esplorare nuove idee creative in modo più efficiente.
Come funziona Stable Fast 3D
Stable Fast 3D si basa sul precedente lavoro di Stability AI con il modello TripoSR, frutto di una partnership con Trip AI. I ricercatori di Stability AI hanno sviluppato metodi innovativi per affrontare le sfide comuni nella ricostruzione 3D veloce, combinando diverse tecniche all’avanguardia.
La tecnologia di Stability AI si basa su una rete neurale di tipo transformer, ovvero un modello di deep learning molto potente nell’elaborazione del linguaggio e delle immagini. Gli ingegneri di Stability AI hanno migliorato questa architettura transformer in modo da generare da una singola immagine 2D tre diversi piani di profondità (triplani) ad alta risoluzione.
Questi triplani contengono informazioni 3D dettagliate sulla scena. In questo modo il modello riesce a catturare più finemente i dettagli 3D eliminando artefatti visivi indesiderati come l’aliasing (distorsione delle linee oblique).
Inoltre, Stable Fast 3D utilizza un approccio probabilistico innovativo per stimare in modo più accurato i materiali, le luci e le ombre dell’immagine 3D risultante. Il risultato sono immagini 3D di qualità migliore e più coerenti.
Oltre il 3D
Stability AI, nota per il suo generatore di immagini AI 2D Stable Diffusion, sta spingendo i limiti dell’intelligenza artificiale oltre il 3D. L’azienda, infatti, ha recentemente annunciato Stable Video 4D, che aggiunge la dimensione temporale alla generazione di brevi video 3D.
Stable Video 4, infatti, è in grado i generare video da 8 angolazioni diverse partendo da un singolo video, per creare contenuti 3D da diverse prospettive.