Luca Annunziata

Google cannibalizza la Ricerca

Un progetto di archiviazione dei dati scientifici che arriva alla Sorgente. Raccontare il progresso dell'umanitÓ con strumenti innovativi

Roma - Adesso vogliono pure la ricerca scientifica. Quelli di Mountain View non si accontentano mai, e lanciano un nuovo progetto dedicato all'archiviazione e pubblicazione di tutto il materiale proveniente dal lavoro di scienziati e ricercatori, più o meno recente, messo a disposizione dai rispettivi autori sulle pagine di Google. L'hanno chiamato "Palimpsest", dal nome del più antico manoscritto di matematica del mondo al cui restauro BigG collabora.

Come già accaduto nel caso del Archimedes Palimpsest, Google mette a disposizione di quanti facciano richiesta un array RAID 5 da tre terabyte. Semplicemente spazio disco, dunque, nella conveniente forma di un piccolo case con interfaccia e-SATA. Una volta che gli scienziati abbiano riempito la memoria, non dovranno fare altro che rispedirla a Google per consentire la diffusione del materiale e la sua indicizzazione.

Il tutto dovrebbe finire in una sorta di incrocio genetico tra Google Code (per quanto attiene la rappresentazione dei testi) e YouTube (che dovrebbe fornire il modello di struttura per i commenti). Nel calderone ci finirà pure Trendalyzer, l'applicazione acquisita lo scorso anno dall'organizzazione non profit Gapminder, in grado di mostrare i dati statistici in modo diretto ed innovativo.
Per partecipare, l'unica condizione posta è che i dati siano tutti rilasciati con licenza Creative Commons, con altre formule "open" o siano di pubblico dominio. Tra i primi contributi si registrano i 120 terabyte delle immagini NASA provenienti dal telescopio orbitante Hubble, il primo terabyte della digitalizzazione del Archimedes Palimpsest, ed infine 10 terabyte in arrivo dall'osservatorio astronomico di Monte Palomar.

Di seguito, alcune slides di presentazione del progetto realizzate da Jon Trowbridge, alle dipendenze di Google e tra i curatori dell'iniziativa:



Se la notizia dovesse far accendere la lampadina del "già visto e già sentito", niente paura: è tutto normale. Poco più di un mese fa, Internet Archive aveva annunciato un programma analogo per la raccolta e l'indicizzazione del materiale di scarto della ricerca (i cosiddetti dark data), cioè la selva disordinata di appunti, grafici, fotografie e banche dati che spesso gli studiosi mettono da parte senza averli fatti conoscere a colleghi e grande pubblico.

C'è solo da augurarsi che i due archivi divengano interoperabili. Ma non potrebbero mettersi d'accordo? Quale progetto riuscirà meglio? Ai posteri, l'ardua sentenza.

Luca Annunziata
20 Commenti alla Notizia Google cannibalizza la Ricerca
Ordina
  • Chiunque conosca un minimo l'ambiente scientifico/universitario sa bene che proff e ricercatori sono in genere gelosissimi anche della loro carta igienica usata.

    Dunque l'offerta di BigG di fornire TB di spazio per "raw data" mi sembra unicamente un'opportunità per coloro che pensano la scienza sia al servizio dell'umanità, e non mera conoscenza d'elite. Gli scienziati che credono nella condivisione dei dati per raggiungere obiettivi comuni approfitteranno dell'opportunità, tutti gli altri... ciccia!

    Poi credo che licenze CC et similia impediranno eventuali interessi particolari di BigG.

    Viva la scienza libera!!
    non+autenticato
  • Personalmente posso essere preoccupato del potere che acquisisce qualcuno che sia in grado di controllare e soprattutto correlare una tale mole di informazioni.
    In realtà lo sono da anni, da quando il nome di Google ha varcato l'oceano per sbarcare da noi.
    Ma non voglio fare del 'losapevismo'(Sorride).

    Questo accade perché:
    1) Google offre un servizio buono, anzi ottimo
    2) gli utenti forniscono liberamente le proprie informazioni
    3) qualcuno ha creduto nelle idee di Google, e soprattutto (evidentemente!) nelle possibilità di rientro finanziario dell'idea.

    E la soluzione al problema non è etica o teorica: se il popolo della rete non gradisce l'oligopolio di Google, Yahoo, Microsoft (e aggiungete tutti quelli che volete), deve rimboccarsi le maniche e creare un'alternativa.

    L'alternativa non la si costruisce con un motore di indicizzazione open source (OK, questo potrebbe risolvere qualche problema), ma investendoci vagoni di soldi.
    Perché il popolo della rete non investe decine o centinaia di milioni di Euro in infrastrutture destinate a contenere un numero spropositato e continuamente crescente di petabytes?

    ╚ inutile pensare a quanto costi un singolo hard disk: pensate soltanto ai costi della corrente, del condizionamento, dei backup, etc.
    Un'iniziativa del genere può essere sostenuta soltanto da un'azienda dedicata e ben finanziata.

    In Europa c'è qualcuno intenzionato ad investire tutti questi soldi? Ad occhio, direi di no (e questo è praticamente certo in Italia).

    Un'alternativa? Un motore di indicizzazione distribuito, in modo che ciascuno sia responsabile del proprio storage e dell'indicizzazione dei propri dati.

    Con almeno i seguenti problemi:
    1) non potrebbe essere considerato attendibile l'esito di una ricerca: ciascuno sarebbe in grado di 'taroccare' i risultati relativi ai risultati per i propri contenuti;
    2) disponibilità nel tempo delle informazioni: non sarebbe possibile garantire che vengano effettuati backup, e che le informazioni che trovo oggi siano disponibili e rintracciabili anche domani.
  • nonti ho letto attentamente chè sono al lavoro,

    ma quello che descrivi non è + o - freenet senza cifratura e con una interfaccia web "globale"???


    ciao
    non+autenticato
  • Ciò che descrivo è semplicemente ciò che ci si può permettere di fare senza investimenti.

    Ma Google (e suppongo anche gli altri motori di ricerca) fanno molto di più:
    1) mantengono una copia delle pagine indicizzate, che è accessibile nel tempo anche dopo la loro sparizione da Internet
    2) cercano di divenire loro stessi i contenitori dell'informazione (vedi i dati della NASA, GSpace, le mail, i blog, gli account e le relazioni tra tutti gli utenti, etc.

    E di tutte le informazioni gestite e raccolte 'garantiscono' la disponibilità nel tempo (OK, non lo garantiscono agli utenti, ma è loro interesse che i dati non si perdano, visto che è su di essi che costruiscono il proprio business).

    Sono funzionalità che Freenet non da (non è il suo scopo).
  • >Si ma che palle.
    >Google quando non era un cazzo andava bene
    >Diventa potente e famosa e subito diventa il mostro pronto a >fagocitare tutto e quindi il male.
    >Leggendo la tua lamentela potrei quasi azzardare che sistema >operativo usi..

    Ma che palle.
    Arriva uno, offre un servizio gratis e tutti gli danno i loro dati pensando che lui i soldi per tenere il servizio attivo li prenda dall' albero dei soldi che ha in giardino.

    Non capisco nemmeno perche' chi si preoccupa del fatto che Google Inc. detenga e abbia accesso ad una mole GIGANTE di dati su chiunque, dati personali, conversazioni private, adesso ci inserisce anche dati di ricerca magari non ancora divulgati, sia considerato un paranoico.
    Sicuramente non distruggera' il mondo, ma il fatto che si stia garantendo il controllo su cosi' tanti dati crea in ogni caso qualche perplessita', sempre che si sappia cosa possa voler dire, ma forse pretendo troppo.
  • Gli danno i loro dati?
    Ma chi ti obbliga ad usarlo?
    non+autenticato
  • - Scritto da: Fabi3tto

    > Sicuramente non distruggera' il mondo, ma il
    > fatto che si stia garantendo il controllo su
    > cosi' tanti dati crea in ogni caso qualche
    > perplessita', sempre che si sappia cosa possa
    > voler dire, ma forse pretendo
    > troppo.

    Che significa "garantirsi il controllo"?
    Che ha una server farm con dentro i dati?

    Se abusasse dei dati, dopo aver costruito un proficuo business sopra al loro uso e distribuzione (pubblicità?), immediatamente qualcun'altro si inserirebbe per farle concorrenza. Dopo tutto, i dati non sono suoi. Lei li rende solo disponibili a chi è interessato ad usarli.

    Oggi, quei dati sono disponibili solo a un numero limitatissimo di addetti ai lavori, mentre domani saranno disponibili a chiunque lo desideri.
    Dove sta il problema non lo capisco.
  • - Scritto da: Fabi3tto
    > inserisce anche dati di ricerca magari non ancora
    > divulgati,

    Hai letto con attenzione?
    Si parla di rilascio delle documentazioni sotto una licenza libera: sai cosa significa? Significa che l'accesso sarà garantito a tutti in modo libero.

    Cosa ci trovi di disdicevole?

    > si stia garantendo il controllo su
    > cosi' tanti dati crea in ogni caso qualche
    > perplessita', sempre che si sappia cosa possa
    > voler dire, ma forse pretendo troppo.

    Non si può avere il controllo esclusivo di documenti pubblicati sotto licenze libere. Sempre che si sappia cosa possano essere. Ma forse pretendo troppo.
    non+autenticato
  • Ave.
    Bisognerebbe intraprendere delle serie e concrete azioni contro questo MONOPOLIO del "Markenting Informatizatto" degli utenti.
    E dire che negli USA di solito sono piuttosto "sensibili" a questo tipo di problemi di "posizione predominante".
    Mah!....vedremo!
    A presto.
    Nilok
    http://informati.blog.tiscali.it/
    http://it.youtube.com/Nilok1959
    Nilok
    1925
  • - Scritto da: Nilok
    > Ave.
    > Bisognerebbe intraprendere delle serie e concrete
    > azioni contro questo MONOPOLIO del "Markenting
    > Informatizatto" degli
    > utenti.

    Forse dovresti prenderti un dizionario e cercarti la parola MONOPOLIO, prima di sparare cavolate Sorride
    "Il monopolio è una forma di mercato dove un unico venditore offre un prodotto o un servizio per il quale non esistono sostituti stretti (monopolio naturale) oppure opera in ambito protetto"

    Ti risparmio la fatica, cosi' la dimostrazione che quanto dici e' infondato e' lampante Occhiolino

    > E dire che negli USA di solito sono piuttosto
    > "sensibili" a questo tipo di problemi di
    > "posizione
    > predominante".

    Infatti lo sono, ma in questo caso non ha molto senso.
    Google e' piu' avanti degli altri, ma non abusa(almeno non ancora) della posizione dominante (semmai lo fa qualche suo concorrente)

    [cut]
    non+autenticato
  • Si ma che palle.
    Google quando non era un cazzo andava bene
    Diventa potente e famosa e subito diventa il mostro pronto a fagocitare tutto e quindi il male.
    Leggendo la tua lamentela potrei quasi azzardare che sistema operativo usi..
    non+autenticato
  • - Scritto da: next
    > Si ma che palle.
    > Google quando non era un cazzo andava bene
    > Diventa potente e famosa e subito diventa il
    > mostro pronto a fagocitare tutto e quindi il
    > male.
    > Leggendo la tua lamentela potrei quasi azzardare
    > che sistema operativo
    > usi..

    Mi sa che hai sbagliato qualcosa, io proprio non mi sono lamentato di google... anzi, ho fatto notare come NON sia monopolista come qualcuno dice.
    Ha una buona fetta di mercato, ma monopolio e' un'altra cosa.
    non+autenticato
  • - Scritto da: Paolino
    > - Scritto da: Nilok
    > > Ave.
    > > Bisognerebbe intraprendere delle serie e
    > concrete
    > > azioni contro questo MONOPOLIO del "Markenting
    > > Informatizatto" degli
    > > utenti.

    > Forse dovresti prenderti un dizionario e cercarti
    > la parola MONOPOLIO, prima di sparare cavolate
    > Sorride
    > "Il monopolio è una forma di mercato dove un
    > unico venditore offre un prodotto o un servizio
    > per il quale non esistono sostituti stretti
    > (monopolio naturale) oppure opera in ambito
    > protetto"
    > Ti risparmio la fatica, cosi' la dimostrazione
    > che quanto dici e' infondato e' lampante Occhiolino

    Beh diciamo che Google gode di una posizione dominante nel settore.

    > > E dire che negli USA di solito sono piuttosto
    > > "sensibili" a questo tipo di problemi di
    > > "posizione
    > > predominante".

    > Infatti lo sono, ma in questo caso non ha molto
    > senso.
    > Google e' piu' avanti degli altri, ma non
    > abusa(almeno non ancora) della posizione
    > dominante (semmai lo fa qualche suo
    > concorrente)

    Nemmeno MS ne abusava all' inizio, quando pero' qualcuno ha cominciato a preoccuparsi gia' era troppo tardi...
  • > Nemmeno MS ne abusava all' inizio, quando pero'
    > qualcuno ha cominciato a preoccuparsi gia' era
    > troppo
    > tardi...

    a me dispiace che l'algoritmo di google sia proprietario, credo lo sia ancora e per molto tempo.
    bisogna però riflettere sulle differenze che hanno portato ms e google ad essere punti di riferimento. il primo facendo il furbo ed imbraccando la strada giusta come serpe in seno all'ibm, il secondo con il lavoro di qualità che ha superato gli altri con l'uso dell'intelligenza facendo divenire realtà il motto "il sapere è potere". per me è difficile non essere entusiasta di google, di come gestiscono il tempo e gli spazi di lavoro, e di molte altre cose anche strettamente connesse a linux ma anche a win.
    facendo anche il paragone con ms di come tutti e due gestiscono la beneficenza, google ne esce come quello più illuminato, ms come quello più tradizionale che con una mano ti dà da mangiare e con l'altra ti avvelena.
    l'unica alternativa è un motore di ricerca open, qualche esperimento c'è già, tutto sta nei cervelli che ci sono dietro ai progetti, quelli di google hanno un alto qi, quelli degli esperimenti hanno molto entusiasmo e buone intenzioni ma difficilmente possono selezionare i contributori con un test del qi, di solito lo ritengono una cosa stupida ...
    non+autenticato
  • - Scritto da: Nilok
    > Bisognerebbe intraprendere delle serie e concrete
    > azioni contro questo MONOPOLIO del "Markenting
    > Informatizatto" degli utenti.
    > E dire che negli USA di solito sono piuttosto
    > "sensibili" a questo tipo di problemi di
    > "posizione predominante".

    Monopolio? Posizione dominante?
    I contenuti di Google sono accessibili da tutti senza dover acquistare nulla. Dove sarebbe il 'mercato'?
    non+autenticato
  • Ciao,
    pensi davvero che goggle non utilizzi in nessun modo che produca denaro le informazioni che raccoglie sulla rete?
    Certo ho sbagliato ad usare la parola monopolio senza metterla tra virgolette, ma il concetto che volevo esprimere è chiaro: la differenza che esiste nell'utilizzo di un "motore di ricerca" tra goggle ed il secondo in classifica mi sembra a dir poco abissale.
    Inoltre ciò che fornisce goggle non è ciò che dovrebbe davvero fare un "Motore di Ricerca": goggle discrimina in base a dei suoi criteri privati che servono solo a trarre profitto dalla rete e non, di sicuro a fornire un VERO criterio STANDARD di ricerca.
    Nilok
    1925
  • - Scritto da: Nilok
    > Ave.
    > Bisognerebbe intraprendere delle serie e concrete
    > azioni contro questo MONOPOLIO del "Markenting
    > Informatizatto" degli
    > utenti.
    > E dire che negli USA di solito sono piuttosto
    > "sensibili" a questo tipo di problemi di
    > "posizione
    > predominante".
    > Mah!....vedremo!
    > A presto.
    > Nilok
    > http://informati.blog.tiscali.it/
    > http://it.youtube.com/Nilok1959

    il monopolio "Markenting Informatizatto" (sempr eche io abbia capito cosa intendi visto che la locuzione è tristemente scialba) non c'è ancora nè probabilmente mai ci sarà.

    semplicemente hanno la MAGGGIORANZA del MERCATO PUBBLICITARIO in quanto controllano la MAGGIORANZA del traffico del web (google/youtube + annessi e connessi come gmail e blogger sono la maggioranza del traffico web).

    hanno scelto la licenza CC quindi sembra che il loro interessa sia davvero solo quello di controllare sempre più traffico, ma del controllo sui contenuti gliene frega poco niente...IMHO
    non+autenticato
  • Ah sì?!?!?!?
    E i soldi, i soldoni, quelli con un numero impressionante di cifre....da dove gli arrivano? dal CC?
    Sai, le Ferrovie dello Stato controllano solo la maggioranza dei treni, in Italia, ma loro hanno scelto di far viaggiare tutti, proprio tutti sui loro treni: bambini, anziani, ricchi, poveri, stupidi ed intelligenti.
    Certo non glie ne frega nulla se i treni arrivano sempre in ritardo o puzzano o sono pieni di scarrafoni....in fondo vogliono solo controllorare tutto il traffico...!!!
    Nilok
    1925
  • - Scritto da: Nilok
    > Ah sì?!?!?!?
    > E i soldi, i soldoni, quelli con un numero
    > impressionante di cifre....da dove gli arrivano?
    > dal
    > CC?

    no dagl introiti della pubblicità che sono direttamente proporzionali al traffico che controllano (leggi sul cu ibrowser visualizzano i google ads)
    non c'è niente di trascendentale in tutto questo.

    > Sai, le Ferrovie dello Stato controllano solo la
    > maggioranza dei treni, in Italia, ma loro hanno
    > scelto di far viaggiare tutti, proprio tutti sui
    > loro treni: bambini, anziani, ricchi, poveri,
    > stupidi ed
    > intelligenti.
    > Certo non glie ne frega nulla se i treni arrivano
    > sempre in ritardo o puzzano o sono pieni di
    > scarrafoni....in fondo vogliono solo
    > controllorare tutto il
    > traffico...!!!

    la differenza è che su internet tutti possiamo decidere se prendere i treni di Google Yahhho o MS Live o Altavista, per andare nello stesso posto epperò tutti prendiamo sempre i treni di google, sarà mica perchè sono sempre in orario?
    non+autenticato