Ma le bombs sono rimaste su Google

di A. Bottoni - Google ha modificato l'algoritmo di page ranking per porre fine al fenomeno del Google bombing. Tuttavia, molte Google bombs sono ancora al loro posto. Che cosa sta succedendo?

Roma - Una Google bomb è una alterazione deliberata ed artificiale del "punteggio" (page rank) che Google attribuisce ad una specifica pagina web, solitamente studiata in modo tale che la pagina "bersaglio" risulti tra le prime dieci che vengono elencate tra i risultati quando si effettua la ricerca di un determinato termine.

Ad esempio, se cercate il termine Wi-MAX con Google, vedrete che la seconda voce che appare tra i risultati della ricerca fa riferimento ad un appello del Partito Pirata Italiano per la liberazione delle frequenze necessarie. Questa pagina si chiama "Liberate il Wi-MAX" e la trovate a questo indirizzo: http://www.partito-pirata.it/liberate_il_WIMAX.html. Potete provare voi stessi questa ricerca facendo click sul link sottostante:
Ricerca di Wi-MAX con Google

Il fatto che questa pagina risulti al secondo posto nell'elenco dei risultati è l'effetto di una Google bomb che abbiamo organizzato a Gennaio del 2007 (L'ideatore di questa iniziativa, e l'autore del documento del Partito Pirata, è anche l'autore di questo articolo). Grazie a questo posizionamento privilegiato, abbiamo ottenuto il risultato di far conoscere le nostre idee riguardo alla liberazione delle frequenze del Wi-MAX a praticamente tutte le persone che si sono interessate di Wi-MAX negli ultimi due mesi e che hanno usato Google per cercare documentazione su questo argomento.
Come funziona Google
Il Google bombing sfrutta una caratteristica di Google che si trova alla base del suo funzionamento: il meccanismo di page ranking.

Quando Sergey Brin e Lawrence Page hanno messo a punto l'algoritmo di base di Google, hanno cercato di fare qualcosa di decisamente più efficace di quello che riuscivano a fare i motori di ricerca del tempo (in particolare Yahoo!). I motori di ricerca degli anni '90 si limitavano ad esplorare la rete ed a creare degli immensi cataloghi di pagine web, classificati in base alle parole chiave che contenevano, senza una vera organizzazione. L'unico modo di ottenere ciò che si cercava era quello di combinare tra loro un numero abbastanza elevato di parole chiave significative in modo da ottenere un numero di risultati abbastanza contenuto da permettere di terminare la ricerca "a mano", esaminando una ad una le pagine.

La goffaggine di questo meccanismo, insieme alla enorme quantità di annunci pubblicitari che inquinavano le pagine dei motori di ricerca, ha avuto l'effetto di allontanare gli utenti da questi strumenti e di decretare l'effimero successo dei "portali" ("web directory"). Come ricorderete, i portali erano cataloghi di siti web pre-selezionati da una èquipe di specialisti. Il più famoso di questi è probabilmente DMoz.

Brin e Page pensarono di usare un meccanismo più sofisticato, basato su un corollario del cosiddetto "effetto rete" ("network effect"). Questo corollario recita: Un elemento della rete è tanto più importante per la rete stessa quanto maggiore è il numero degli altri elementi che fanno riferimento ad essa

Nel caso delle pagine web (e di interi siti), l'importanza della pagina è tanto maggiore quanto più elevato è il numero delle pagine web che contengono un collegamento ("link") ad essa. Questo meccanismo è noto anche come Link Analysis e si appoggia ad una teoria matematica nota come Analisi Markoviana dei Processi.

La versione originale dell'algoritmo di Brin e Page, concepito come tesi di laurea a Stanford, è ancora oggi reperibile su Internet a questo indirizzo. Da allora, a questo algoritmo sono state apportate diverse modifiche ma il suo funzionamento resta sostanzialmente lo stesso.

In pratica, Google funziona nel modo seguente:
1. Ad intervalli regolari (una volta ogni settimana o due), un apposito programma, chiamato "spider" o "crawler", "spazza" il world wide web alla ricerca di pagine web.
2. Da ognuna di queste pagine web, lo spider estrae una serie di termini che possono essere usati per la ricerca, le cosidette "keyword". La pagina viene catalogata tra quelle che contengono ognuno di questi termini, in modo che sia possibile ritrovarla in seguito. Questo processo è noto come "indicizzazione".
3. Per ognuna di queste pagine viene determinato anche il numero di altre pagine che fanno riferimento ad essa attraverso un link. Questo processo è noto come "page ranking".
In seguito, quando l'utente cerca una determinata parola chiave, Google agisce nel modo seguente:
1. Esamina i suoi indici e carica un elenco di tutte le pagine che contengono il termine cercato.
2. Queste pagine vengono elencate in base al loro page rank. Maggiore il page rank, più alta la loro posizione nell'elenco.
Dato che gli utenti raramente esaminano le voci che appaiono oltre la decima o la ventesima posizione dell'elenco, ottenere un elevato page rank è vitale per calamitare l'attenzione del pubblico. In realtà, ottenere questo risultato è talmente importante che sul web esistono decine di agenzie che di mestiere fanno solo questo: cercano di far arrivare i siti dei loro clienti tra le prime dieci posizioni dell'elenco quando si effettua la ricerca di determinati termini. Si tratta delle agenzie di Search Engine Optimization (SEO).
33 Commenti alla Notizia Ma le bombs sono rimaste su Google
Ordina
  • Vorrei esprimere una critica costruttiva, cerando di differenziarmi da coloro che insultano senza nemmeno riflettere poiché sembrano aver bisogno di un capro espiatorio con cui sfogarsi.

    A mio giudizio un articolo scritto con questa forma è innanzitutto troppo autoreferenziale. Ci sono elementi interessanti, ma il tono vagamente sensazionalistico, la forma non troppo fluente, e le reiterate citazioni a sé stesso danno una forte impressione dilettistica, rovinando il potenziale valore informativo.

    Vorrei soffermarmi anche su aspetti più precisi. La frase "Queste pagine vengono elencate in base al loro page rank. Maggiore il page rank, più alta la loro posizione nell'elenco" è, se non errata, fortemente imprecisa. Il Page Rank, infatti, è solo uno dei tanti elementi che concorrono al posizionamento delle pagine, non è certo l'unico e probabilmente nemmeno il più rilevante. Quello di considerare il page rank come il principale perno su cui gira il posizionamento è un errore piuttosto vecchio e facilmente smontabile (si controlli il PR delle prime 10 voci con una decina di ricerche competitive e si scoprirà che non c'è proporzionalità nel PR).

    Un altro appunto riguardo la google-bomb spiegata (quella su Wi-Max). Google impiega pochi giorni a rendersi conto che una pagina identica è pubblicata su vari siti, ed in brevissimo tempo la penalizza inesorabilmente. L'idea di pubblicare un'identica pagina in Creative Commons, oltre ad essere "deontologicamente" poco corretta, è sostanzialmente frutto di una superficiale conoscenza dell'algoritmo di Google.

    Nell'articolo è inoltre presente un'evidente forzatura che mette in legame l'annuncio del contrasto alle google bomb con il caso Bush. Avendo un minimo di conoscenza della filosofia commerciale di Google si capisce che assolutamente improbabile che questo sia il quadro reale.

    Altra cosa, pensare che google utilizzi una "blacklist" o un thesaurus e dipingere questo come un fatto assodato è un errore grossolano. L'algoritmo di google si basa prevalentemente su calcoli di tipo semantico, con l'analisi di reti di senso che si sviluppano e affinano di giorno in giorno automaticamente grazie alle ricerche degli utenti.

    Affermare che i sistemi SEO si basano su migliaia di doorway disseminate sul web mi pare MOLTO azzardato, ci vorrebbe qualche fonte o prova per queste dichiarazioni.

    Mi spiace dirlo, ma buona parte dell'articolo si basa su supposizioni (cosa in teoria piuttosto coumne in questo campo), di cui alcune dimostratamente errate o imprecise/superficiali. A questo si aggiunge la forma dello scritto e la sostanziale mancanza di fonti con test specifici o studi metodologicamente scientifici che avvallino anche solo parzialmente le testi proposte.

    Questa è la mia impressione, un saluto cordiale,
    Jack
    non+autenticato
  • Ho fatto la ricerca su google cercando Wi-Max (anche wimax) e non ho trovato nulla riguardo il partito dei pirati, a parte il nome pessimo se collegato ad un discorso sulla liberta non sarebbe meglio fare semplicemente un'articolo sull'aspetto politico sul wi-max piuttosto che fare questa figura da tecno-peracottari?
    Siamo in mano ai lamers.
    non+autenticato

  • - Scritto da:
    > Ho fatto la ricerca su google cercando Wi-Max
    > (anche wimax) e non ho trovato nulla riguardo il
    > partito dei pirati, a parte il nome pessimo se
    > collegato ad un discorso sulla liberta non
    > sarebbe meglio fare semplicemente un'articolo
    > sull'aspetto politico sul wi-max piuttosto che
    > fare questa figura da
    > tecno-peracottari?
    > Siamo in mano ai lamers.

    E tu chi sei?
    http://www.google.it/search?hl=it&q=wi-max&btnG=Ce...=

    al secondo posto guarda chi c'e'
    ah! svegliati, o almeno taci no?
    non+autenticato
  • Azioni di protesta condotte con l'assistenza di blogger, possessori di siti personali etc. = buono
    Manipolazioni dei risultati di ricerca con squallide linkfarm e altri giochetti = buono
    Goliardate realizzate con l'aiuto degli stessi blogger & co. prima citati = cattivo.



    Secondo me c'è un piccolo errore in tutto questo.
    non+autenticato
  • si e porta il tuo nome.
    1016
  • ... le mail bombing sono state usate pesantemente per far scalare la classifica a siti civetta distributori di malware e similare (come gromozon e dialer vari)....

    stanno ancora a galla questi ?


    non+autenticato
CONTINUA A LEGGERE I COMMENTI
1 | 2 | 3 | Successiva
(pagina 1/3 - 12 discussioni)