Alfonso Maruccia

DeepStereo, lo stop-motion 3D di Google

Mountain View presenta un nuovo algoritmo in grado di generare una rappresentazione 3D in movimento di una serie di immagini statiche. Necessita di migliorie, soprattutto sul fronte dei tempi di elaborazione

Roma - Google è al lavoro su un nuovo algoritmo di visualizzazione chiamato DeepStereo, una tecnologia progettata per "imparare" a rappresentare il mondo in un modo nuovo, a partire dal materiale fotografico catturato in serie. Il tutto è ovviamente reso possibile dalle risorse e dalle capacità di calcolo dei sistemi di Mountain View, anche se i margini di miglioramento non mancano.


DeepStereo applica gli algoritmi di deep learning di Mountain View per produrre una rappresentazione tridimensionale delle due foto dello stesso soggetto prese da angolazioni diverse, inferendo la transizione necessaria a dare l'illusione del movimento a partire dalle caratteristiche proprie delle foto.

Il sistema di Google analizza le caratteristiche di colore e le informazioni di profondità dei pixel e degli oggetti di una foto, valutando poi lo spostamento dei succitati oggetti con un'analisi della seconda foto e così via fino alla creazione di un filmato e una scena continui.
Per "addestrare" a dovere le capacità di DeepStereo, Mountain View ha dato in pasto alle sue reti neurali circa 100mila set di immagini catturate con la fotocamera di StreetView; la fase di elaborazione delle immagini è poi avvenuta all'interno di una camera "virtuale" all'interno del software, analizzando separatamente colore e profondità dei pixel da usare per riempire il vuoto tra una foto e l'altra.

DeepStereo è un sistema di creazione di panorami 3D realistici utili su StreetView ma anche per le teleconferenze, la cinematografia, la realtà virtuale e le animazioni in stop-motion, sostiene Google, anche se al momento i ricercatori di Mountain View sono impegnati a migliorare l'algoritmo sul fronte dei tempi di calcolo necessari a processare ogni singola immagine di un set (12 minuti) su una workstation multi-core.

Alfonso Maruccia
Notizie collegate