Claudio Tamburrino

Google indicizza Bing?

Milioni le anteprime di immagini di Bing indicizzate da BigG. Messa in dubbio la sua legittimità, la pratica è stata interrotta - UPDATE: le spiegazioni di Google

UPDATE 03/06 - Google ha fornito la sua versione della vicenda: il problema risiederebbe in un automatismo che ha fatto troppo diligentemente il suo dovere, poiché le immagini non erano state adeguatamente protette tramite il file robot.txt da Bing stessa. Secondo BigG, l'indicizzazione delle anteprime è avvenuta dunque in modo automatico, e iniziative sono già state prese per rimuovere comunque le immagini dal database del motore di ricerca di Mountain View. Situazione per altro già chiarita in passato.

Roma - Mentre il motore di ricerca indica le immagini di Bing, l'utente guarda Google. Mountain View è stata beccata ad indicizzare milioni di immagini delle anteprime di Bing. In seguito al dibattito scaturito, in ogni caso, ha già interrotto tale pratica.

La situazione è stat notata sul Webmaster Help forum di Google, dove un utente ha scritto di aver trovato 8 milioni di immagine cache di anteprime di Bing indicizzate da Google Image. Il Googler che ha risposto alla richiesta di intervento ha spiegato che si tratta semplicemente di immagini senza restrizioni e che quindi sono state raccolte come qualsiasi risultati pescato online, senza distinzioni.
A febbraio, viceversa, era Google ad accusare il motore di ricerca di Microsoft di copiare i suoi risultati. Fatto che ora è chiamato in causa per creare qualche grattacapo a Mountain View.

Nella stessa discussione sul forum viene messa in dubbio l'opportunità da parte di Google di indicizzare le cache di ricerche per immagini, che rischiano di ospitare opere protette da diritto d'autore dando per esempio visibilità ai siti che le ospitano illecitamente; così come in particolare il fatto di indicizzare le anteprime di un altro motore di ricerca, fatto di cui presumibilmente la stessa Google si lamenterebbe se a farlo fosse Bing.

Claudio Tamburrino
Notizie collegate
8 Commenti alla Notizia Google indicizza Bing?
Ordina
  • Non mi stupisce affatto un comportamento del genere, cosi come non mi stupisce scoprire che Google utilizza IP diversi dal solito e ben conosciuto per indicizzare.
    Non mi stupisce neanche il fatto che molti dei motori di ricerca semisconosciuti, siano al soldo di Google o forse sono una loro azienda distaccata che fa sempre capo a loro.

    Come faccio a saperslo? Bhe, con uno script incrocio i dati log dei miei siti con Whois e vengono fuori cose molto, ma molto interessanti.

    Non sono un ingegnere, in questo caso mi stupisco invece che yahoo e Bing non si siano accorti che questa specie di abuso venga perpetrato da anni.
    non+autenticato
  • - Scritto da: cognome
    > Non mi stupisce affatto un comportamento del
    > genere, cosi come non mi stupisce scoprire che
    > Google utilizza IP diversi dal solito e ben
    > conosciuto per
    > indicizzare.

    Se non vuoi che google ti indicizzi basta usare gli strumenti appositi.
    Comunque vorrei capire se secondo te esiste davvero un unico indirizzo IP "ben conosciuto" che indicizza tutte le pagine dei diversi paesi nel mondo a cui si aggiungono degli IP occulti e misteriosi che compiono ogni genere di nefandezza.

    > Non mi stupisce neanche il fatto che molti dei
    > motori di ricerca semisconosciuti, siano al soldo
    > di Google o forse sono una loro azienda
    > distaccata che fa sempre capo a
    > loro.

    Definire "al soldo". Cylon

    > Come faccio a saperslo? Bhe, con uno script
    > incrocio i dati log dei miei siti con Whois e
    > vengono fuori cose molto, ma molto
    > interessanti.

    Brrrr... un brivido m'è corso lungo la schiena. Sorride

    > Non sono un ingegnere, in questo caso mi stupisco
    > invece che yahoo e Bing non si siano accorti che
    > questa specie di abuso venga perpetrato da
    > anni.

    Quale abuso? Indicizzare un sito web pubblico?
    E Yahoo e Bing secondo te che fanno, passano il tempo smacchiare i giaguari?
    Ubunto
    1334
  • ma secondo te il sistema di ricerca e catalogazione di Google utilizza un singolo IP cioè, se va bene, un singolo datacenter o forse ci sono tecniche più "pervasive" per ottenere poi i miracolosi risultati del motore di google?
    ... mi sa che ti sei perso qualche passaggio ...
    e quale sarebbe questo "ip ben conosciuto"?

    poi questa cosa di paragonarla a Bing che RUBAVA da google è bellissima ...

    in quel caso Bing usava Google per le ricerche che poi "riconfezionava" per mostrarle ai suoi utonti.
    non+autenticato
  • - Scritto da: Lostman
    > ma secondo te il sistema di ricerca e
    > catalogazione di Google utilizza un singolo IP
    > cioè, se va bene, un singolo datacenter o forse
    > ci sono tecniche più "pervasive" per ottenere poi
    > i miracolosi risultati del motore di google?
    >
    > ... mi sa che ti sei perso qualche passaggio ...
    > e quale sarebbe questo "ip ben conosciuto"?

    No, pero' la lista di tutti gli IP dei crawler di google sono noti e/o verificabili, come quelli di bing, quelli Yahoo!, quelli di Ask.com...
    http://googlewebmastercentral.blogspot.com/2006/09...

    > poi questa cosa di paragonarla a Bing che RUBAVA
    > da google è bellissima
    > ...
    >
    > in quel caso Bing usava Google per le ricerche
    > che poi "riconfezionava" per mostrarle ai suoi
    > utonti.

    Allora... dal file robots.txt di Bing:
    ...
    Disallow: /images/search?
    Disallow: /images?
    ...

    A parte questo, Bing usa(va) tutti i segnali possibili per indicizzare una pagina, tra questi che anche il referral-url che sono mandati dagli utenti di IE (facendo accetta sull'apposito box durante l'installazione/primo avvio).

    Se una pagina, X ha un referral-url del tipo http://example.com/gino/pino.html, a far parte dei termini che identificano una pagina ci sono anche "example", "gino" e "pino".

    A parte che sembra una cosa molto furba e che ha senso non e' illegale: rubare e' illegale. Gli url che ritorna Google non appartengono a Google ma a gente come me e te e Google gli indicizza.

    Il fatto che Google mandi tutte le cose che cerchi in chiaro come parametri della url invece di impacchettarli in una post e/o usare https e' un problema di Google piu' che di Bing.

    Per altro, al padrone del sito non poteva che fare piacere l'essere indicizzato anche da Bing oltre che da Goolge e per di piu' con parole extra per essere trovato Sorride
    non+autenticato
  • beh, dopo aver fatto fare una figura barbina a Microsoft per bing, ora vediamo come se la cavano quelli di BigG per giustificare questo comportamento.

    che la legge dantesca abbia colpito anche in questo caso?
  • XD azzeccatissima...