Gaia Bottà

Google trova un padre alle opere orfane

Un file XML per districarsi fra tutte le opere letterarie statunitensi. Perché i cittadini della rete si possano accertare del proprio diritto ad attingervi senza incorrere in violazioni

Roma - Non tutti i testi sono blindati, non tutte le opere restano intoccabili per tempi interminabili: la cultura libraria statunitense del secolo scorso sta andando a rimpinguare il pubblico dominio. Come districarsi fra opere orfane, opere protette, opere in pubblico dominio? Come discernere fra i testi ai quali è possibile attingere a piene mani e quelli su cui si può contare sul solo fair use? Google offre ai netizen una bussola da qualche centinaia di mega, un file XML che raccoglie tutte le opere sulle quali è possibile sferruzzare senza alcun limite.

A favore dei cittadini che intendano orientarsi negli intricati meandri della legge sul diritto d'autore statunitense, esistono i registri del Copyright Office: parte dell'archivio che raccoglie lo status delle opere è rintracciabile online, ma sono ancora volumi polverosi a tenere traccia delle opere letterarie registrate prima del 1978. Vi sono custoditi i dati relativi alla registrazione dei testi e alle operazioni di rinnovo previste dalle leggi statunitensi. Rinnovi che gli autori hanno compiuto tra il 1923 e il 1964 per non far cadere le proprie opere in pubblico dominio.

Proprio su questi archivi ha agito il gruppo che lavora allo Universal Library Project presso la Carnegie Mellon University: con una scansione ha tramutato in immagini le pagine dei registri. Ancora poco agile il movimento del cittadino fra le numerosissime pagine dell'archivio. In questa contingenza si è dunque inserito il paziente lavorìo di Distributed Proofreaders e di Project Gutenberg: trasformate in testo le immagini fornite dallo University Library Project, hanno operato un controllo certosino per rimediare agli errori commessi dal sistema OCR.
Poi, l'intervento di Google: Jarkko Hietaniemi ha combinato l'archivio online del Copyright Office e i dati scaturiti dalla digitalizzazione degli archivi cartacei e li ha fatti convergere in un unico file XML, scaricabile e consultabile dai cittadini della rete. Il blog di Google Book Search ne annuncia con orgoglio il rilascio: un sussidio utile alla grande G per accertarsi della liceità della propria opera di scansione e pubblicazione massiva, diventa un regalo messo a disposizione dei netizen affinché alimenti la loro cultura, la loro voglia di creare e reinventare e di restituire vita alle opere del passato.

A fronte dell'annuncio roboante di Mountain View, sono in molti ad esultare e a plaudere all'iniziativa di Google. C'è però chi si interroga sulla maneggevolezza di un file XML da oltre 350 MB: un'iniziativa simile è stata condotta dall'Università di Stanford e consente di sfogliare gli archivi e di rintracciare opere del passato senza scaricare alcunché.

Gaia Bottà