Mauro Vecchio

Google e il Rinascimento digitale

Stretta di mano tra il MiBAC e la Grande G: saranno circa un milione i volumi portati in formato digitale. Provenienti dalle biblioteche di Firenze e Roma, che avranno così la possibilità di sbarcare anche su Europeana

Roma - Un Rinascimento. Non solo inteso come periodo di rigogliosa fioritura delle lettere, ma anche come risveglio nella diffusione del sapere in formato elettronico. È la visione di Google, che ha recentemente annunciato sul suo blog ufficiale un accordo da molti definito storico. La ricchissima tradizione letteraria del Belpaese verrà digitalizzata e resa accessibile ad un più vasto pubblico di lettori.

I lettori italiani e stranieri potranno non solo rileggere classici da banchi di scuola come Dante e Petrarca, ma anche scoprire le opere più oscure di Guglielmo il Giuggiola o di Coluccio Salutati. Perché saranno circa un milione i volumi della più antica letteratura italiana a sbarcare negli archivi del progetto Google Books. Opere più e meno note, non coperte dal diritto d'autore, che verranno messe a disposizione della Grande G da parte delle principali biblioteche italiane.

"Si tratta della prima intesa a livello governativo che permette a un protagonista del web di accedere a un patrimonio librario nazionale". È il primo commento rilasciato da Sandro Bondi, ministro per i Beni e le Attività Culturali, su un accordo di collaborazione per un massiccio progetto di digitalizzazione dei tesori (anche quelli più nascosti) delle biblioteche nazionali di Roma e Firenze.
Quella di Firenze, ad esempio, metterà a disposizione di Mountain View alcune rare opere scientifiche risalenti al periodo dell'Illuminismo, oltre ad una serie di opere letterarie del XIX secolo. Poi Roma, che fornirà i suoi gioielli cartacei, frutto del pensiero di Giambattista Vico, Keplero e Galileo Galilei.

Stando ad un comunicato stampa, l'accordo tra il MiBAC e Google prevederà dunque la digitalizzazione di circa un milione di volumi, 285mila dei quali sono stati già metadatati e catalogati dal Servizio Bibliotecario Nazionale (SBN). Nei due anni successivi verrà poi completata la catalogazione dei volumi scelti, che saranno digitalizzati da BigG e quindi messi online. E sarà la stessa Grande G a farsi carico dell'intero costo di digitalizzazione, prevedendo inoltre l'allestimento di uno scanning center nel Belpaese.

"Questo accordo con Google, che definirei storico, si prefigge tre obiettivi - ha dichiarato Mario Resca, direttore generale per la Valorizzazione del patrimonio culturale - In primo luogo, digitalizzare e diffondere nel mondo parte dell'enorme tesoro librario italiano. In secondo luogo, conservarlo e preservarlo in eterno dagli agenti atmosferici e dall'usura del tempo. In ultimo, con la messa online gratuita di questo patrimonio, promuoviamo la conoscenza in tutto il mondo della nostra cultura, rendendola accessibile a tutti".

Si tratta dunque di una stretta di mano che - almeno nella visione dei due attori in gioco - fornirà al Belpaese una nuova maniera per valorizzare i propri beni. E a Google una più che ghiotta occasione di accaparrarsi un patrimonio letterario come pochi al mondo. Ma c'è un'altra opportunità a disposizione del MiBAC: quella di approdare in maniera più consistente tra i meandri digitali del progetto Europeana.

Sempre secondo i dettagli principali dell'accordo, Google fornirà alle due biblioteche di Roma e Firenze le copie digitali di ciascun libro, così che possano a loro volta renderli disponibili anche su piattaforme diverse da quella di Mountain View, come appunto quella legata a Europeana.

Un'occasione da non perdere per BigG, in modo tale da espandere il suo parco di biblioteche, attualmente una quarantina, con quelle di Harvard e Oxford a fare da apripista. E anche un modo per esorcizzare le ostiche difficoltà incontrate lungo il cammino del progetto Book Search, a partire dal contenzioso attualmente in atto in terra statunitense sulle cosiddette opere orfane. Che non saranno incluse nel nuovo Rinascimento digitale nel paese tricolore.

Mauro Vecchio
Notizie collegate
26 Commenti alla Notizia Google e il Rinascimento digitale
Ordina
  • Questa è un'ottima notizia! Finalmente un passo operativo nella direzione della tanto auspicata Condivisione della conoscenza, Knowledge Sharing, a sua volta fulcro dello sviluppo della Società della Conoscenza
    non+autenticato
  • L'importante è che la scansione dei libri sia di Pubblico Dominio. Il fatto che il libro sia in PD non comporta necessariamente che la scansione lo sia. E neanche il fatto che la scansione sia liberamente accessibile via web o scaricabile, non significa che sia i PD.

    Se la scansione non viene pubblicata in PD poi non è possibile utilizzarla per lavori derivati (vedi le trascrizione di Wikisource o altri siti)
    non+autenticato
  • Nell'informativa legale che accompagna ogni pdf liberamente scaricabile (libri di pubblico dominio) è chiaramente scritto che google consente ogni utilizzo NON COMMERCIALE dell'opera scansionata

    il fatto che google, scansionando i libri, li diffonda con queste clausole, è una garanzia (essendo nel paese della SIAE) da soprusi (vedi dichiarazioni di direttori di biblioteche che o ignorando i principi di googlebooks o la normativa in materia di diritto d'autore, credevano di poter *blindare* i testi scansionati di cui certo non detenevano i diritti)
  • Se c'è arrivato pure google toccherà cominciare a guardare al barocco.
  • si si ... tutto molto bello...
    sig. bond & il trio no-privacy... mah...

    solo qualche domandina che sorge di primo acchitto:

    - quali formati immagine per le scansioni?

    - quali formati per l'archiviazione?

    - quali database per archiviare e gestire i metadati?

    - le scansioni saranno di pubblico dominio (se ho ben capito, ma non ne sarei tanto sicuro)... e i database? chi ne deterrà i diritti?

    - chi / dove / come sarà archiviato il tutto?

    - chi / dove / come renderà disponibile il tutto agli umani?

    qualcuno ha risposte a queste domande?
    non+autenticato
  • > - quali formati immagine per le scansioni?

    è ragionevole supporre che saranno tiff g4 in bianco e nero (dati grezzi) poi riprocessati con l'algoritmo di compressione jbig2

    solo per fare un esempio, un libro di 333 pagine scansionato in tif g4, una pagina per tiff, produce 16 MB di tiff g4, gli stessi 333 tiff, compresi con algoritmo jbig2 pesano appena 4 MB o poco più. la qualità rimane la stessa, ciò che cambia è il metodo di compressione che adopera un dizionario di simboli che, proprio come per i dati binari, riduce le ridondanze nel file

    questi file jbig2 vengono poi assemblati insieme in un unico pdf

    l'encoder jbig (jbig2enc) è software libero

    http://github.com/agl/jbig2enc

    >- quali formati per l'archiviazione?
    Google potrebbe o conservare i tiff in bianco/e nero oppure le scansioni a colori (se ne fa) o i pdf

    > - chi / dove / come sarà archiviato il tutto?
    su googlebooks e i libri dovrebbero essere disponibili anche su europeana e sui singoli siti delle biblioteche partner, oltre che nei datacenter di google e questa è la migliore garanzia in un paese dove associazioni a scopo di lucro per interesse tendono a frenare la libera diffusione dei saperi

    > - chi / dove / come renderà disponibile il tutto agli umani?
    Google; ma tra due anni almeno
  • - Scritto da: Teone
    > > - quali formati immagine per le scansioni?
    >
    > è ragionevole supporre che saranno tiff g4 in
    > bianco e nero (dati grezzi) poi riprocessati con
    > l'algoritmo di compressione
    > jbig2

    beh... è una supposizione: c'è un qualche accordo no? dove stanno scritte queste cose?

    e poi: la fruizione di molti libri e documenti storici (miniature, libri di medicina, cartografie ecc.) ha senso solo se si dispone del colore...

    > solo per fare un esempio, un libro di 333 pagine
    > scansionato in tif g4, una pagina per tiff,
    > produce 16 MB di tiff g4, gli stessi 333 tiff,
    > compresi con algoritmo jbig2 pesano appena 4 MB o
    > poco più. la qualità rimane la stessa, ciò che
    > cambia è il metodo di compressione che adopera un
    > dizionario di simboli che, proprio come per i
    > dati binari, riduce le ridondanze nel
    > file
    >
    > questi file jbig2 vengono poi assemblati insieme
    > in un unico
    > pdf
    >
    > l'encoder jbig (jbig2enc) è software libero
    >
    > http://github.com/agl/jbig2enc

    benissimo! ma chi lo dice che useranno formati liberi ed aperti (e, per inciso, tiff non mi risulta che lo sia)?

    e anche in questo caso: dove stanno scritti i formati?

    > >- quali formati per l'archiviazione?
    > Google potrebbe o conservare i tiff in bianco/e
    > nero oppure le scansioni a colori (se ne fa) o i
    > pdf

    mah... ho qualche dubbio...

    "ricopio" la logica del tuo ragionamento: google NON vuole rendere disponibile ogg vorbis su youtube preferendo mantenere FLV e H.264, è quindi ragionevole supporre che NON adotterà formati liberi ed aperti per i libri digitalizzati...

    > > - chi / dove / come sarà archiviato il tutto?
    > su googlebooks e i libri dovrebbero essere
    > disponibili anche su europeana e sui singoli siti
    > delle biblioteche partner, oltre che nei
    > datacenter di google e questa è la migliore
    > garanzia

    scusa se mi permetto... ma per me google è solo garanzia di gente che mira esclusivamente al profitto, con qualsiasi mezzo... dont be evil è solo marketing...

    > in un paese dove associazioni a scopo di
    > lucro per interesse tendono a frenare la libera
    > diffusione dei
    > saperi

    è esattamente ciò che sembra voler fare anche il nostro governo riguardo ai beni culturali in genere... e guarda caso questo "accordo" è sponsorizzato da mr. bond...

    >
    > > - chi / dove / come renderà disponibile il
    > tutto agli
    > umani?
    > Google; ma tra due anni almeno
    non+autenticato
  • - Scritto da: CCC

    >
    > scusa se mi permetto... ma per me google è solo
    > garanzia di gente che mira esclusivamente al
    > profitto, con qualsiasi mezzo... dont be evil è
    > solo
    > marketing...

    Solo che compete con chi mira al profitto spacciando ignoranza e copie digitali non copiabili per bollo. Fino a quando qualche altro sarà evil fin nel midollo, l'alone angelico gli spetterà di diritto.
  • > è una supposizione:
    [...]
    resa congetturalmente più che plausibile dalla conoscenza e dall'analisi della tecnologia sin qui impiegata da google nel suo progetto di digitalizzazione

    > dove stanno scritte queste cose?
    [...]
    http://www.imperialviolet.org/binary/google-books-...

    > la fruizione di molti libri e documenti storici (miniature, libri di medicina, cartografie ecc.) ha
    > senso solo se si dispone del colore...
    [...]
    non necessariamente, gli scanner antipiani con cui google effettua le digitalizzazioni (simili a queel della serie Booksnap della Atiz)

    http://booksnap.atiz.com/

    quando non competamente automatizzati (le pagine vengono girate automaticamente grazie ad un congegno che o volta le pagine una dopo l'altra attraendole a sé - si tratta di un braccio meccanico sopra il centro del libro - con una leggera aspirazione o sfruttando la carica elettrostatica, e poi le fotografa)

    possono riprodurre in bianco e nero dettagli anche di disegni a colori, grazie alla illuminazione uniforme se comunque vi fossero particolari impossibili da rappresentare con fedeltà a 2 bit colore, è sempre possibile usare un algoritmo mixed, bianco e nero per il testo, colore per l'immagine; ciò porta naturalmente ad un incremento nelle dimensioni finali

    > chi lo dice che useranno formati liberi ed aperti?
    [...]
    sempre il documento di cui sopra; il formato sarà lo stesso di quello utilizzato sinora su googlebooks (pdf + epub); il pdf ha il vantaggio di essere facilmente sproteggibile anche se al documento vengono aspplicate restrizioni di copia e stampa (non è il caso dei libri di googlebooks e sarebbe il caso che te li andassi a vedere per rassicurarti)
    -----------------------------------------------------------
    Modificato dall' autore il 11 marzo 2010 18.44
    -----------------------------------------------------------
  • - Scritto da: CCC
    > "ricopio" la logica del tuo ragionamento: google
    > NON vuole rendere disponibile ogg vorbis su
    > youtube preferendo mantenere FLV e H.264, è
    > quindi ragionevole supporre che NON adotterà
    > formati liberi ed aperti per i libri
    > digitalizzati...

    HTML5 non è ancora standard, rassicurati. Anzi, se ti fossi informato, H.264 è il formato in cui vengono codificati i video già da tempo; quelli .flv sono già codificati in H.264. Google, aspettando uno standard, ha ritenuto saggio (e mi sembra anche normale) non ricodificare tutto il database di video, che sarebbe stato dispendioso in quanto risorse. Tanto più che, non essendoci uno standard, potrebbe essere lavoro buttato. Google per il web, lavorando all'HTML5, ha già dimostrato di cercare soluzioni aperte e uguali per tutti... È un'azienda, tutto ciò che fa naturalmente lo fa per lucro, ma se lo fa in maniera condivisibile e/o etica non ci vedo nulla di male. Capirei tutta questa ostilità se avesse lavorato su lock-in e sistemi chiusi...
    non+autenticato
  • Bondi che fa una cosa giusta? magari l'ha fatta per sbaglio Sorride
    non+autenticato
  • - Scritto da: eheheh
    > Bondi che fa una cosa giusta? magari l'ha fatta
    > per sbaglio
    > Sorride

    più facile che non sia una cosa giusta...
    non+autenticato
CONTINUA A LEGGERE I COMMENTI
Successiva
(pagina 1/2 - 8 discussioni)