Cristina Sciannamblo

Google, via alla digitalizzazione italiana

Parte il progetto frutto dell'intesa tra MiBAC e Google Books. Centinaia di migliaia le opere librarie italiane che saranno trasformate in file digitali. L'iniziativa italiana al centro di un più vasto accordo internazionale

Roma - Dalla Biblioteca Nazionale Centrale di Roma parte il progetto volto alla digitalizzazione del patrimonio librario italiano, frutto dell'accordo siglato tra il Ministero per i Beni e le Attività Culturali (MiBAC) e Google. L'intesa, sottoscritta nel 2010, prevede la trasformazione in file digitali di testi rari e di pregio, che vanno da un minimo di 500mila a un massimo di un milione di volumi.

La prima edizione de I Promessi sposi di Alessandro Manzoni, conservata dalla Biblioteca Nazionale Centrale di Roma, il libretto della prima rappresentazione della Traviata di Giuseppe Verdi, custodito dalla Biblioteca Nazionale Centrale di Firenze, i volumi degli Annali civili del Regno delle due Sicilie, consultabili alla Biblioteca Nazionale di Napoli, saranno i primi volumi che tra qualche mese sarà possibile ritrovare online gratuitamente. Google effettuerà la digitalizzazione dei testi attraverso un apposito Scanning Center aperto in Italia e provvederà al trasferimento dei libri nonché alla loro assicurazione.

Le versioni digitali saranno visualizzabili e scaricabili gratuitamente in quanto opere di pubblico dominio e reperibili sui siti web delle Biblioteche, su Internet culturale, su Cultura Italia e su Europeana o su qualsiasi altro sito presente o futuro afferente al Mibac, nonché su Google Books.
L'iniziativa italiana è parte di un progetto di dimensioni globali, che coinvolge paesi come Stati Uniti, Inghilterra, Germania, Francia, Austria, Spagna, Olanda, Repubblica Ceca, Giappone e biblioteche nazionali di rilevanza mondiale, come la Bayerische Staatsbibliothek di Monaco di Baviera, la British Library di Londra, l'Österreichische Nationalbibliothek di Vienna e la Nationale Bibliotheek van Nederland de L'Aja.

Cristina Sciannamblo
Notizie collegate
  • AttualitàDigitalizzazione, Europeana sfida Google BooksL'ultimo rapporto della Commissione europea preposta alla digitalizzazione del patrimonio culturale del vecchio continente si esprime in materia di copyright. E lancia la sfida alla mediateca di Mountain View
  • AttualitàEuropeana, 14 milioni di bit di sapereRaggiunta la quota di 14 milioni di opere gratuite e online. In Rete anche le edizioni originali di capolavori della letteratura finora disponibili solo su carta
  • AttualitàGoogle e il Rinascimento digitaleStretta di mano tra il MiBAC e la Grande G: saranno circa un milione i volumi portati in formato digitale. Provenienti dalle biblioteche di Firenze e Roma, che avranno così la possibilità di sbarcare anche su Europeana
13 Commenti alla Notizia Google, via alla digitalizzazione italiana
Ordina
  • Il primo archivio di libri consultabili e scaricabili
    gratuitamente esiste già da tempo...

    http://www.liberliber.it
  • - Scritto da: sentinel
    > Il primo archivio di libri consultabili e
    > scaricabili
    > gratuitamente esiste già da tempo...
    >
    > http://www.liberliber.it

    Forse è il primo in Italia, non nel mondo. Il Progetto Gutenberg è stato iniziato negli Usa dallo studente Michael Hart nel 1971.

    In ogni caso, l'argomento non è chi è arrivato per primo con l'idea. Ma chi ha le competenze e le risorse per sobbarcarsi un compito simile.
    non+autenticato
  • - Scritto da: Leguleio
    > - Scritto da: sentinel
    > > Il primo archivio di libri consultabili e
    > > scaricabili
    > > gratuitamente esiste già da tempo...
    > >
    > > http://www.liberliber.it
    >
    > Forse è il primo in Italia, non nel mondo. Il
    > Progetto Gutenberg è stato iniziato negli Usa
    > dallo studente Michael Hart nel
    > 1971.

    Si, volevo dire il primo in Italia.

    > In ogni caso, l'argomento non è chi è arrivato
    > per primo con l'idea. Ma chi ha le competenze e
    > le risorse per sobbarcarsi un compito
    > simile.

    Beh, liberliber ha fatto tanta strada finora...Occhiolino
  • - Scritto da: sentinel


    > > In ogni caso, l'argomento non è chi è
    > arrivato
    > > per primo con l'idea. Ma chi ha le
    > competenze
    > e
    > > le risorse per sobbarcarsi un compito
    > > simile.
    >
    > Beh, liberliber ha fatto tanta strada finora...Occhiolino

    Lo seguo dal lontano 1998. Capisco l'impegno che ci mettono, ma nel tempo che i volontari digitalizzano un singolo libro, Google ne digitalizza 100. Achille contro la tartaruga, hai presente?
    non+autenticato
  • - Scritto da: Leguleio
    > - Scritto da: sentinel
    >
    >
    > > > In ogni caso, l'argomento non è chi è
    > > arrivato
    > > > per primo con l'idea. Ma chi ha le
    > > competenze
    > > e
    > > > le risorse per sobbarcarsi un compito
    > > > simile.
    > >
    > > Beh, liberliber ha fatto tanta strada
    > finora...
    >Occhiolino
    >
    > Lo seguo dal lontano 1998. Capisco l'impegno che
    > ci mettono, ma nel tempo che i volontari
    > digitalizzano un singolo libro, Google ne
    > digitalizza 100. Achille contro la tartaruga, hai
    > presente?

    Quindi se oggi invece di 100, di libri ne abbiamo 101 dobbiamo ringraziare l'uno e l'altro.
  • - Scritto da: panda rossa
    > - Scritto da: Leguleio
    > > - Scritto da: sentinel
    > >
    > >
    > > > > In ogni caso, l'argomento non è
    > chi
    > è
    > > > arrivato
    > > > > per primo con l'idea. Ma chi ha le
    > > > competenze
    > > > e
    > > > > le risorse per sobbarcarsi un
    > compito
    > > > > simile.
    > > >
    > > > Beh, liberliber ha fatto tanta strada
    > > finora...
    > >Occhiolino
    > >
    > > Lo seguo dal lontano 1998. Capisco l'impegno
    > che
    > > ci mettono, ma nel tempo che i volontari
    > > digitalizzano un singolo libro, Google ne
    > > digitalizza 100. Achille contro la
    > tartaruga,
    > hai
    > > presente?
    >
    > Quindi se oggi invece di 100, di libri ne abbiamo
    > 101 dobbiamo ringraziare l'uno e
    > l'altro.
    giusto. E poi quando e' partito liberliber gli scanner erano costosi, nemmeno era nato VideoOnLine (quindi c'erano 3-4 mini provider internet in italia), l'OCR peggio ancora.
    E le procedure sono sempre rimaste rigorose (basta vedere qui http://www.liberliber.it/progetti/manuzio/collabor... )... non e' che facevano su un pdf formato da blob di jpg...

    Approfitto per dire una cosa VERGOGNOSA che P.I. si e' dimenticato (troppo imbarazzo) di riportare, riguardo la "magnifica" operazione del MiBac-google :

    "(...)I file digitali dei volumi potranno essere liberamente e gratuitamente visualizzabili in full text e scaricabili poiché si tratta di opere di pubblico dominio (editate fino al 1871) che non rientrano nelle limitazioni imposte dalla legge sul diritto d’autore(..)"

    Bisogna SEMPRE ricordare quanto faccia SCHIFO la legge sul (c) ... (e quanto sono zelanti nel rispettarla... )
    non+autenticato
  • Partirà in Italia il processo telematico, per ora solo per il Sud e per i processi civili:

    http://lastampa.it/2012/12/19/italia/cronache/proc...
    non+autenticato
  • Anzitutto una critica a PI: troppa pubblicità!! quando ho cliccato sull oggetto del messaggio è partita una pagina pubblicitaria che già mi aveva annoiato prima!! Ci diamo una clamata redazione? La notizia. Ho un paio di osservazioni da fare:
    1)La scansione. E' un 'operazione delicatissima e lenta se si vuol farla bene. I testi devono essere "ben spalancati" sul piano dello scanner..E con libri antichi non so proprio come si può fare senza rischiare di strapparli.
    Certo, dopo se ne ha una copia digitale ma non è la stessa cosa..
    Il riconoscimento del testo (ocr) è una roba che spesso va male e ci vuole qualcuno che "corregga" il testo digitalizzato a mano, il che significa confrontare il testo digitalizzato con l'originale sfogliandolo...E questa follia andrebbe ripetuta centinaia di migliaia di volte? ma quanti soldi e tempo hanno questi qua? Che tecnologie usano? mah
    -----------------------------------------------------------
    Modificato dall' autore il 19 dicembre 2012 13.27
    -----------------------------------------------------------
    -----------------------------------------------------------
    Modificato dall' autore il 19 dicembre 2012 13.28
    -----------------------------------------------------------
  • - Scritto da: einsteniano


    > Il riconoscimento del testo (ocr) è una roba che
    > spesso va male e ci vuole qualcuno che "corregga"
    > il testo digitalizzato a mano, il che significa
    > confrontare il testo digitalizzato con
    > l'originale sfogliandolo...E questa follia
    > andrebbe ripetuta centinaia di migliaia di volte?
    > ma quanti soldi e tempo hanno questi qua? Che
    > tecnologie usano?

    Essendo una compagnia privata non sono tenuti a dire come fanno. Io sospetto che si servano da società specializzate in Cina, che operano così: vengono fatte due copie di ogni pagina da digitalizzare, e ogni pagina viene affidata a una persona addestrata, o un gruppo, che digita il testo al PC all'insaputa dell'altra, nemmeno si conoscono. Finita la digitalizzazione, di fatto pura dattilografia, le copie si collazionano: è estremamente difficile che due persone diverse compiano lo stesso errore nella stessa parola, con una lingua che non conoscono. Quindi il responsabile della collazione deve solo controllare in quali punti il testo non coincide, e correggere lì.

    Il metodo pare lento, ma è più veloce che affidarsi agli scanner e all'OCR e correggere milioni di errori dopo, ovviamente quando si trattano testi antichi (e peggio che mai i manoscritti).
    non+autenticato
  • - Scritto da: einsteniano
    > Anzitutto una critica a PI: troppa pubblicità!!
    > quando ho cliccato sull oggetto del messaggio è
    > partita una pagina pubblicitaria che già mi aveva
    > annoiato prima!! Ci diamo una clamata redazione?
    > La notizia. Ho un paio di osservazioni da
    > fare:
    > 1)La scansione. E' un 'operazione delicatissima e
    > lenta se si vuol farla bene. I testi devono
    > essere "ben spalancati" sul piano dello
    > scanner..E con libri antichi non so proprio come
    > si può fare senza rischiare di strapparli.
    > Certo, dopo se ne ha una copia digitale ma non è
    > la stessa cosa..
    > Il riconoscimento del testo (ocr) è una roba che
    > spesso va male e ci vuole qualcuno che "corregga"
    > il testo digitalizzato a mano, il che significa
    > confrontare il testo digitalizzato con
    > l'originale sfogliandolo...E questa follia
    > andrebbe ripetuta centinaia di migliaia di volte?
    > ma quanti soldi e tempo hanno questi qua? Che
    > tecnologie usano?
    > mah

    Ho amici ipovedenti che mi dicono che le tecnologie di OCR sono migliorate enormemente negli ultimi anni, ma lo vedi anche dai vari programmini di riconoscimento del linguaggio naturale nati ultimamente come siri e simili.
    krane
    22544
  • dagli anni '90 che si parla di digitalizzazione, conversione e le varie strututre pubbliche nazionali ed europee hanno fatto poco...ma dico, se si faceva un'investimento a lungo termine sulle tecniche di scansione/archiviazione ecc non si poteva arrivare ad arrivare una tecnologia/organizzazione decente in modo tale che si sarebbe potuto procedere al passaggio epocale del cartaceo al digitale. Questo evento non è che succede di continuo, tra gli anni 90 e 00 c'era la consapevolezza che si stava di fronte a un passaggio che sarebbe stato ricordato nei secoli, un evento eccezionale. La figura del bibliotecario/archivista doveva essere centrale, diventare protagonista, cambiare e far cambiare il mondo addormentato degli archivi. Oltretutto si sarebbero avuto m oltissime occasioni di lavoro, dal bruto scanning e data entry a competenze di archiviazione digitale e organizzazione dati
    Ora è la multinazionale di turno ad avere la teconolgia e le competenze, il pubblico ha dormito come al soltio e adesso qualche burocrate soddisfatto sarà tranquillo "perchè ci pensa gugol"...come godere di essere pachidermi comprimari paganti invece che protagonisti
    non+autenticato
  • - Scritto da: niuno

    > dagli anni '90 che si parla di digitalizzazione,
    > conversione e le varie strututre pubbliche
    > nazionali ed europee hanno fatto poco...ma dico,
    > se si faceva un'investimento a lungo termine
    > sulle tecniche di scansione/archiviazione ecc non
    > si poteva arrivare ad arrivare una
    > tecnologia/organizzazione decente in modo tale
    > che si sarebbe potuto procedere al passaggio
    > epocale del cartaceo al digitale.


    Hai detto bene: europee. È un problema comune. Il sito francese Gallica, che è partito almeno 7 anni prima di Google, nel 1997, non riesce a fare tutto, con i mezzi che ha, al punto che una proposta di collaborazione con Google libri era stata avanzata due anni fa:

    http://www.degroupnews.com/actualite/n4390-numeris...


    > Ora è la multinazionale di turno ad avere la
    > teconolgia e le competenze, il pubblico ha
    > dormito come al soltio e adesso qualche
    > burocrate soddisfatto sarà tranquillo "perchè ci
    > pensa gugol"...come godere di essere pachidermi
    > comprimari paganti invece che
    > protagonisti

    La dura realtà è questa: per fare la scansione e il riconoscimento automatico dei caratteri di un testo, soprattutto un testo antico, ci vogliono risorse, monetarie e tecnologiche, che solo Google ha. È l' outsourcing della cultura, se vuoi: si demanda a un Paese estero ciò che si potrebbe fare in casa, ma a prezzi molto superiori e con tempi di lavoro più lunghi.
    non+autenticato
  • - Scritto da: niuno
    > dagli anni '90 che si parla di digitalizzazione,
    > conversione e le varie strututre pubbliche
    > nazionali ed europee hanno fatto poco...ma dico,
    > se si faceva un'investimento a lungo termine
    > sulle tecniche di scansione/archiviazione ecc non
    > si poteva arrivare ad arrivare una
    > tecnologia/organizzazione decente in modo tale
    > che si sarebbe potuto procedere al passaggio
    > epocale del cartaceo al digitale. Questo evento
    > non è che succede di continuo, tra gli anni 90 e
    > 00 c'era la consapevolezza che si stava di fronte
    > a un passaggio che sarebbe stato ricordato nei
    > secoli, un evento eccezionale. La figura del
    > bibliotecario/archivista doveva essere centrale,
    > diventare protagonista, cambiare e far cambiare
    > il mondo addormentato degli archivi.
    starai scherzando spero... le major travestite da politici per anni non si somo nemmeno accorti del digitale (nei primi anni 90 le warez erano legali, figurati), Dopo invece l'hanno preso come nemico xche lede(va) gli interessi suddetti. Le biblio poi in genere sono ignorate se non per aggiungere problemi... dalle beghe-tasse sulle fotocopie, alle incredibili preoccupazioni per la pirateria che hanno creato rogne su rogne... basta leggere i bollettini. Giusto giusto ora hanno trovato qualche accrocco legal-drm fatto da societa private per dare i prestiti digitali come volevano gli editori, pardon i politici.

    Oltretutto
    > si sarebbero avuto m oltissime occasioni di
    > lavoro, dal bruto scanning e data entry a
    > competenze di archiviazione digitale e
    > organizzazione
    > dati
    idee (e anche competenze) e' vero ..ne esiste(vano)... ma principalmente orientate alla gestione documentale (conservare le scartoffie delle p.a.)... e gia li' ci sono problemi. Far fruire libri o altro al pubblico , gratis poi, e' un set di eresie abnormi (qualcosa si muove, ma sempre lento come tartaruga zoppa)

    > Ora è la multinazionale di turno ad avere la
    > teconolgia e le competenze, il pubblico ha
    > dormito come al soltio e adesso qualche
    > burocrate soddisfatto sarà tranquillo "perchè ci
    > pensa gugol"...
    eheh figurarsi che tutti gli editori del mondo hanno rotto le palle a G quando ha detto che faceva il lavoro gratis... certo, in usa sono piu ricettivi, nonostante le gilde..
    Ma io addirittura penso ai privati (non aziende)... non so se ci rendiamo conto che i fan, gratis, hanno ormai digitalizzato tipo 100000 comic books... (compresa roba da microfilm -qualita mediocre ,ma se tutti ti contrastano- , roba rara o misconosciuta... roba fuori dal [c] xche le leggi Usa erano piu fiscali negli anni 40-60, ecc). OVVIAMENTE tutto materiale e persone osteggiate , perche la major non ci puo guadagnare. Non importa se sia materiale prodotto da gente o aziende morte.
    non+autenticato