Giorgio Pontico

Google Book Search sfoglia sempre meglio

BigG adotta nuovi strumenti per fagocitare più velocemente documenti scritti. Ma deve farsi largo tra chi grida al furto di opere e chi teme per l'accessibilità

Roma - L'acquisizione di libri non è più un ostacolo per Google. Il colosso del search ha brevettato un sistema, ideato da Francois-Marie Lefevere e Marin Saric, che renderà più veloce l'ingresso di nuovi titoli nell'archivio di Google Book Search.

Le ormai vecchie tecnologie di digitalizzazione richiedevano che ogni pagina arrivasse allo scanner in maniera nitida e, sopratutto, come immagine piana. Un'eventuale curvatura della pagina avrebbe infatti rischiato di compromettere l'attività del software OCR preposto alla digitalizzazione dei contenuti.

Il brevetto 7508978, denominato Detection of grooves in scanned images, consente di superare l'ostacolo costituito dalla scanalatura centrale, tipica di molti supporti cartacei come libri o riviste, responsabile dell'inarcamento del foglio. Proiettando un raggio infrarosso sul libro aperto e con l'ausilio di due fotocamere ad infrarossi poste ai lati del dispositivo si otterrà l'immagine della pagina in tre dimensioni, indispensabile per determinare i parametri da utilizzare affinché il software la possa leggere in maniera corretta.
Google dunque non vivisezionerà più i volumi, in nome della fruibilità sul Web. Infatti fino a poco tempo fa, per risolvere il problema della convessità delle pagine rilegate, a Mountain View erano soliti ghigliottinare romanzi, saggi e trattati riducendoli a semplici risme da mandare alla scansione. In molti casi il sacrificio di una copia ai fini della conservazione online non era giudicato un delitto ma il discorso cambiava, e di molto, quando si mandavano al macello libri rari.

In ogni caso l'intento di raccogliere tutto lo scibile umano in qualche Tera aveva ricevuto in principio feedback positivi, tanto che sono molte le biblioteche che ad oggi hanno confermato la propria disponibilità a svuotare temporaneamente i propri scaffali per consentire l'indicizzazione.

Iniziato da Google nel 2004 questo processo di raccolta ha incontrato non pochi problemi legati al copyright, che secondo i legali di alcune case editrici veniva palesemente violato. Al mondo dell'editoria non andava proprio giù lo sfruttamento delle opere ancora coperte dal diritto d'autore, mentre tollerava che Google inglobasse senza sosta quelle di pubblico dominio.

Oltre ai chiarimenti ci sono voluti 125 milioni di dollari per far intuire ai manager delle case editrici le potenzialità commerciali messe a disposizione da Book Search. Tuttavia negli ultimi tempi l'operato di Mountain View è finito ugualmente sotto la lente d'ingrandimento dell'Antitrust, imbeccato da diversi oppositori, tra i quali figura il nome di Microsoft, secondo i quali tale accordo darebbe a Google il monopolio su quella fetta di mercato.

Brester Khale, fondatore di Internet Archive, si è schierato tra le fila degli avversari di BigG, sostenendo in un'intervista che le ambizioni del motore di ricerca vadano oltre ciò che si era prospettato all'inizio: Google vuole diventare la libreria o la biblioteca della Rete. Inoltre secondo Khale era ed è molto pericoloso permettere ad una sola entità di controllare l'accesso ad una quantità di contenuti che, grazie a quest'ultima trovata di Google, potrebbe crescere con velocità sempre maggiore.

Giorgio Pontico
6 Commenti alla Notizia Google Book Search sfoglia sempre meglio
Ordina
  • ...non lo nego...ma sinceramente non capisco l'ultima frase: "era ed è molto pericoloso permettere ad una sola entità di controllare l'accesso ad una quantità di contenuti che, grazie a quest'ultima trovata di Google, potrebbe crescere con velocità sempre maggiore."

    infatti, se i contetuti vengono semplicemente riportati "paro-paro", che problema c'e'? sarebbe come se il direttore della biblioteca civica della mia citta' considerasse come "dittatori" i colleghi delle due nazionali centrali che abbiamo qui in italia...

    certo, il discorso cambia se parliamo di persone che si "fidano solo di google" e pensano -sfruttando il "motorone"- di fare la bibliografia di una tesi di laurea o di dottorato.
    ma queste persone esistono? sicuramente si' e -mia esperienza- sono tantissime.

    ma allora a questo punto il problema non e' di google, ma delle testoline di siluro che codesti "utenti" si ritrovano...

    ciao,

    fabianope
  • Infatti noi fotografiamo i testi e non li scannerizziamo.
    Ovviamente non usiamo OCR nè PDF ma un metodo nostro a base fotografica. Niente coprygth di terze parti poichè ci occupiamo di libri antichi o comunque fuori da vincoli di coprygth di autore o editore.
    Probabilmente il nostro metodo passerà inosservato, siamo in Italia e gli editori, che sarebbero i nostri potenziali clienti se ne fregano, preferiscono le vecchie tecnologie... Fino a che Google li "obbligherà" ad acquistare i suoi prodotti. E allora pagheranno fior di quattrini per le licenze, per stare sul mercato.
    www.librivirtuali.com
  • - Scritto da: ninjaverde
    > Infatti noi fotografiamo i testi e non li
    > scannerizziamo.
    > Ovviamente non usiamo OCR nè PDF ma un metodo
    > nostro a base fotografica. Niente coprygth di
    > terze parti poichè ci occupiamo di libri antichi
    > o comunque fuori da vincoli di coprygth di autore
    > o
    > editore.
    > Probabilmente il nostro metodo passerà
    > inosservato, siamo in Italia e gli editori, che
    > sarebbero i nostri potenziali clienti se ne
    > fregano, preferiscono le vecchie tecnologie...
    > Fino a che Google li "obbligherà" ad acquistare i
    > suoi prodotti. E allora pagheranno fior di
    > quattrini per le licenze, per stare sul
    > mercato.
    > www.librivirtuali.com

    al contrario.. non sono pochi quelli che usano le macchine fotografiche per acquisire in vece dello scanner. C'e' piu di un package che usa 2 fotocamere incrociate (una per pagina), con le 2 pagine tenute sufficientemente angolate per non scassare la costola..
    non+autenticato
  • > > www.librivirtuali.com
    >
    > al contrario.. non sono pochi quelli che usano le
    > macchine fotografiche per acquisire in vece dello
    > scanner. C'e' piu di un package che usa 2
    > fotocamere incrociate (una per pagina), con le 2
    > pagine tenute sufficientemente angolate per non
    > scassare la
    > costola..

    Infatti è un sistema che non ha nulla di nuovo, ma la pubblicità di Google convincerà molti ad usare il loro sistema.

    In particolare il medodo suggerito da librivirtuali.com è un sistema diverso in quanto non si usano brevetti già in uso, ma un sistema che prevede la possibilità di consultare libri e manoscritti a cui non è possibile applicare un sistema OCR.
    Ma vorrei aggiungere che col sistema fotografico (tipo fac-simile) si puossono anche tollerare difetti di piegature (non eccessive) poichè le pagine rimangono comunque leggibili all'occhio umano.
  • ogni volta che una tecnologia irrompe e cambia le regole del gioco c'è sempre qualcuno che non ci dorme la notte. ricordo napster ai tempi d'oro, se non avessero continuato fregandosene dell'illegalità a quest'ora staremmo indietro di decenni nella distribuzione dei contenuti.

    qui certo, c'è un gigante che può far paura, ma perchè le società che adesso si lamentano del probabile monopolio non si sono svegliate prima?

    che noia.
    non+autenticato
  • Certo, questo è un rischio, però mettiamo sulla bilancia anche i vantaggi che (almeno attualmente) ne derivano!!!
    non+autenticato