Affidare al software il riconoscimento di una foto per annotare dove la si è scattata, ricostruire una storia, ricordare: questo il sogno che alcuni ricercatori della Carnegie Mellon University stanno cercando di realizzare. Per farlo, studiano immagini fotografiche prive di referenziazione con l’aiuto di Flickr e tentano di individuare il luogo esatto , il “dove” ritratto nelle foto.
Per raggiungere l’obiettivo, i ricercatori hanno raccolto in un database sei milioni di fotografie da Flickr, tutte accuratamente dotate di coordinate geografiche dagli utenti. Hanno quindi scritto un software per confrontare la foto da esaminare con tale database, impiegando una tecnica particolare.
Secondo i ricercatori il loro metodo ha permesso di “indovinare correttamente” il punto in cui è stata scattata una foto priva di riferimenti 30 volte meglio del metodo basato sulla semplice “fortuna”. C’è chi si chiede quale sia il metodo usato per misurare queste 30 volte, dato che la varietà dei soggetti è talmente vasta da richiedere forse numeri ben maggiori di sei milioni.
Tuttavia la promessa è allettante, almeno per alcuni soggetti: come si può osservare dalle immagini qui di lato, fornite dallo stesso Ateneo, il software è riuscito ad individuare correttamente monumenti importanti quali ad esempio la Cattedrale di Notre Dame.
Non altrettanto è accaduto con soggetti più generici, come la zebra ritratta in Tanzania che è stata attribuita, invece, ad una ripresa realizzata in Kenia. Ma allora su cosa si basa il funzionamento di questo algoritmo e in cosa consiste l’innovazione?
L’obiettivo che si pongono i ricercatori non è quello di individuare e riconoscere particolari come la zona, gli abiti, le scritte nelle strade, la vegetazione ed altri dettagli simili, bensì quello di analizzare la composizione intima dell’immagine. In altri termini, colori, palette , numero e orientamento di linee ed altri dettagli grafico-geometrici. La ricerca nel database avviene seguendo proprio questi vettori.
“Non chiediamo al computer di dirci dove è stata ritratta la foto, ma di trovare altre foto che gli assomiglino”, dice Alyosha Efros, uno dei ricercatori che ha collaborato al progetto. La somiglianza, secondo gli scienziati, porta ad un ventaglio di foto che danno – insieme – indicazioni che si starebbero rivelando “molto attendibili” sulla zona di esposizione.
Lo sviluppo dovrebbe portare, dunque, a svincolare le foto dalla necessità della georeferenziazione attraverso meccanismi puramente matematici. La chiave non sarebbe quindi l’individuazione delle coordinate in sé, ma l’evidenziare quei dettagli grafico-geometrici che diano segnali di somiglianza con un’altra foto georeferenziata.
D’altro canto, se è vero che gli utenti Flickr possono dotare i propri lavori di coordinate geografiche, se altri atenei hanno tentato di individuare i luoghi di scatto delle foto e se importanti produttori di cellulari dotano gli apparecchi di tale caratteristica, è pur vero che la stragrande maggioranza delle foto ancora oggi viene scattata senza alcun riferimento geografico . Il che, in un’ottica puramente duepuntozero , per una foto costituisce un punto a sfavore che la CMG tenta di superare creando una sorta di fotorete sociale .
“Mentre i primi risultati sembrano promettenti – concludono i ricercatori – resta ancora molto lavoro da fare. La nostra speranza è che questo studio possa porsi come trampolino di lancio per nuovi orizzonti di ricerca nella computer vision geografica”.
Marco Valerio Principato