Facebook. Mentre il principale detentore di informazioni personali su Web si prepara a dare il via a nuove iniziative di integrazione, advertising profilato e raccolta dei dati degli utenti, gli avvocati tuonano e minacciano i ricercatori indipendenti che sfruttano i profili pubblici senza però aver avuto “l’autorizzazione” a farlo.
Il ricercatore è Pete Warden, e il motivo del contendere è costituito da un archivio di più di 210 milioni di profili pubblici usato per mettere insieme una “mappa” ragionata delle connessioni esistenti fra gli utenti. Warden aveva raccolto le informazioni seguendo i dettami dal file robots.txt , presente su ogni server web con il preciso compito di istruire i crawler sulle pagine web accessibili per l’analisi e l’archiviazione.
In molti – almeno 50 scienziati, ha sostenuto Warden – avevano espresso interesse per l’accesso (gratuito) ai dati con finalità di studio, ma la possibilità rimarrà solo sulla carta giacché il ricercatore è stato infine costretto da Facebook a cancellare tutto per evitare di incorrere in contraccolpi legali dall’esito e dal costo incerti (oltreché insostenibili per l’autore).
“Come potete immaginare – ha commentato Warden – non sono molto felice della cosa, soprattutto dal momento che nessuno ha mai ipotizzato che la mia raccolta di informazioni fosse fuori dalle regole con cui il Web ha funzionato sin da quando esistono i crawler”.
Il file robots.txt è la fonte primaria di informazioni pubblicamente accessibili di “centinaia di motori di ricerca commerciali” e gli stessi dati raccolti da me, dice il ricercatore, sono ospitati e accessibili nella cache di Google senza nemmeno passare dai server di Facebook.
Ma quello che vale per un colosso da miliardi di dollari come Google, a quanto pare, non è altrettanto valido per un piccolo ricercatore indipendente che non vuole monetizzare i dati raccolti sugli utenti. Stando a quanto ha comunicato Andrew Noyes, manager delle comunicazioni sulla policy pubblica di Facebook, Pete Warden “ha aggregato una gran quantità di dati da oltre 200 milioni di utenti senza il nostro permesso, in violazione delle nostre condizioni. Ha inoltre dichiarato pubblicamente la propria volontà di rendere i dati grezzi gratuitamente disponibili agli altri”. E Google? E i motori di ricerca? Altra storia.
Alfonso Maruccia