Il team di Google Brain ha sviluppato un sistema basato su reti neurali in grado di aggiungere dettagli alle immagini a risoluzione molto bassa. Sebbene il risultato che si può ottenere sia ancora lontano dall’essere perfetto, in molti casi può avvicinarsi alla realtà. Una immagine di un primo piano da 8×8 pixel è inutilizzabile, ma grazie a questo software può diventare in pochi istanti un viso riconoscibile.
Se si guarda l’immagine sopra riprodotta, tratta dal documento di presentazione della tecnologia, si vede che la colonna di sinistra contiene una immagine da 8×8 pixel (indistinguibile), mentre nella colonna al centro si può vedere l’immagine che il software di Google Brain è in grado di creare dalla sorgente 8×8 pixel. Nella colonna a destra sono mostrate le immagini reali per effettuare una comparazione. Come si può vedere, il software ha apparentemente estratto una quantità incredibile di dettagli da soli 64 pixel.
Google Brain sfrutta una combinazione di due reti neurali. La prima, la rete condizionata, prova a rappresentare la sorgente 8×8 pixel confrontandola con altre immagini ad alta risoluzione, dopo averle ridotte a 8×8 pixel e cercando di farle combaciare. La seconda, la rete prioritaria, utilizza una implementazione di PixelCNN per ricercare e aggiungere dettagli realistici ad alta risoluzione all’immagine sorgente da 8×8 pixel. In sostanza, la rete prioritaria incamera un gran numero di immagini reali ad alta risoluzione – nel caso preso in esame, di celebrità e di camere da letto. Poi, quando l’immagine sorgente viene ingrandita, essa cerca di aggiungere nuovi pixel che combacino con ciò che la rete “conosce” circa quella classe di immagine. Per esempio, se c’è un pixel marrone verso la sommità dell’immagine, la rete prioritaria può identificare quell’elemento come un sopracciglio. Così, quando l’immagine è portata a risoluzione maggiore, può riempire il vuoto con una collezione di pixel marroni a forma di sopracciglio.
Per creare l’immagine finale ad alta risoluzione, i risultati delle due reti neurali sono mescolati fra loro. Con il risultato finale di avere aggiunto nuovi dettagli.
La tecnica ad alta risoluzione di Google Brain è sufficientemente efficace nei test effettuati nella realtà. Quando agli osservatori umani è stata mostrata una immagine reale ad alta risoluzione di personaggi celebri, per confrontarla all’immagine ingrandita dal computer, questi sono stati ingannati per il 10 per cento delle volte (il 50 dovrebbe essere un punteggio ideale). Una percentuale maggiore (28 per cento) di osservatori si è fatta ingannare dall’immagine computerizzata di una camera da letto.
Non è ancora chiaro a chi potrebbe tornare utile una simile applicazione. Google Plus (su alcuni smartphone Android) dispone già di una funzione simile per la compressione delle immagini. È importante notare che l’immagine computerizzata ad alta risoluzione creata da Google Brain non è reale. I dettagli aggiunti – che vanno sotto il nome di “allucinazioni” nel gergo dell’image processing – sono niente altro che le migliori supposizioni. Questo fa sorgere alcuni problemi spinosi di applicazione, specialmente nel campo della sorveglianza e forense. La sofisticata tecnologia Google non potrebbe essere utilizzata dalla polizia, ad esempio, per identificare in modo definitivo un sospetto (non allo stato attuale, almeno), ma potrebbe aiutare a convalidare il fatto che un elemento sospettato sia realmente presente sullo sfondo di una fotografia. Inoltre, potrebbe essere utile per chiarire piccoli dettagli nelle foto, che sfuggono quando queste sono portate a dimensioni maggiori.
Pierluigi Sandonnini