Dario D'Elia

Il guru degli algoritmi di Google si concede

Amit Singhal non può rivelare i segreti del mestiere ma racconta qualche aneddoto su come lavora il team del search del gigante di Mountain View

Mountain View - C'è voluto del tempo ma alla fine Amit Shingal, il "guru degli algoritmi" di casa Google, si è lasciato intervistare dal New York Times, che ne ha tirato fuori un articolo di un certo interesse per chi vuole sapere cosa bolle al Googleplex. Già, perché la sofisticata macchina di Google sforna servizi e novità a ripetizione: non sorprende che il team di sviluppatori e ingegneri che collaborano con Singhal implementino ogni settimana circa mezza dozzina di piccole correzioni alle funzionalità di search.

"La ricerca negli ultimi anni si è spostata dal dammi cosa scrivo al dammi cosa voglio", spiega Singhal. Una sfida che ormai ha a che fare con decine di miliardi pagine web indicizzare, centinaia di milioni di query quotidiane e un sevizio complessivo declinato in 112 lingue. "Le aspettative sono alte adesso", sottolinea Udi Manber, responsabile del search-quality group di Google. "All'inizio individuare quello che si cercava era considerato un miracolo. Adesso se non si trova nei primi tre risultati, vuol dire che c'è qualcosa di sbagliato".

Secondo Manber ormai si tratta di una questione di bilanciamento degli interventi: un cambiamento può insomma migliorare una cosa e peggiorarne un'altra. Il tutto comunque viene registrato sul "Buganizer", il sistema utilizzato internamente per i report sugli eventuali problemi. "Qualcuno segnala una query che non funziona a Amit, e lui ne fa tesoro cercando di immaginarsi come risolvere la cosa algoritmicamente", ha dichiarato Matt Cutts, collaboratore di Singhal, blogger e guru SEO in Google.
Un esempio di queste correzioni? Durante le ultime elezioni francesi la locuzione French Revolution ha prodotto più risultati sul confronto Royal-Sarkozy che sulla fine della Monarchia. Un piccolo intervento ha permesso di valorizzare le pagine web che indicavano esattamente la frase "French Revolution", invece di quelle che mostravano solo le due parole - in ordine sparso magari.

Si tratta certamente di una piccola operazione - che gli utenti possono affrontare anche solo con indici booleani specifici - ma anche in questo caso Singhal ha avviato il suo Debug, software di debugging per valutare query e pagine correlate. "È anche vero però che non si può reagire alla prima segnalazione. Hai bisogno che le cose cuocciano a fuoco lento", aggiunge il "Google Fellow".

Lo scorso anno, ad esempio, uno dei problemi più urgenti ha riguardato la questione dei risultati "freschi", ovvero correlati alle pagine web appena create o recentemente aggiornate. Il problema di fondo si poteva sintetizzare semplicemente in: meglio fornire le nuove informazioni o le pagine che nel tempo si sono distinte per qualità? Fino a quel momento Google aveva preferito la seconda opzione, approfittando anche del conseguente linking. Singhal, però, ha deciso di cambiare strategia, soprattutto considerando l'avvento di nuovi servizi che si avvantaggiano dell'aggiornamento in tempo reale, come ad esempio Google Finance.

All'inizio di questa primavera il team al completo si è riunito. Singhal ha spiegato che la semplice variazione delle formule - per aumentare il numero delle pagine web nuove - avrebbe abbassato la qualità complessiva dei risultati. L'unica soluzione, a suo parere, era adottare un nuovo modello matematico che cercasse di prevedere le esigenze degli utenti. Il QDF (Query deserves freshness) è stato quindi messo sotto attento studio. Il nodo è stato determinare quanto e quando un argomento è "caldo": incrociando i dati provenienti dal numero delle query correlate ad un certo tema e le nuove pubblicazioni (o aggiornamenti) inerenti, è possibile aggiungere un elemento in più di determinazione del ranking.

Sighal ha ammesso di aver iniziato a testare il QDF in piccole applicazioni: tipo decidere quando e se includere pochi titoli giornalistici accanto ai normali risultati quando qualcuno effettua ricerche su temi gettonati.

Di fatto si tratta di un'ulteriore piccola implementazione che fra qualche mese potrebbe nascondersi dietro qualcosa di più importante. Il lavoro di Singhal, dal 2000, è stato proprio quello di arricchire il sistema di page ranking con almeno 200 altri tipi di informazione - detti "signals". Questi comprendono elementi presenti sulle pagine web (parole, link, immagini etc.), negli storici, nei data pattern etc.

Chi utilizza i servizi di Google, come ad esempio Gmail, dispone infatti di un'arma ancora più efficiente, perché il suo storico personale online influenza i risultati delle proprie ricerche. "Le persone pensano ancora che Google è lo standard di riferimento della ricerca", ha aggiunto Battelle: "In verità il suo segreto è nel come riesce a far lavorare insieme i suoi ragazzi".

Dario d'Elia
25 Commenti alla Notizia Il guru degli algoritmi di Google si concede
Ordina
  • ovviamente il deposito universalmente riconosciuto è nella tua testa!

    pendiamo tutti dalle tue labbra...ILLUMINACI!
    Nilok
    1925
  • Quote----
    ovviamente il deposito universalmente riconosciuto è nella tua testa!

    pendiamo tutti dalle tue labbra...ILLUMINACI!
    --- end

    Senti questo lo hai scritto tu:
    "Se cerco solo mela, il primo riferimento è il significato della parola mela e quindi il primo link dovrebbe essere quello dove sta la definizione UNIVERSALMENTE riconosciuta della paorla mela"

    Illuminaci quindi dove si troverebbe il deposito di queste definizioni universalmente riconosciute. Grazie!
    non+autenticato
  • grazie per il tuo contributo.

    Non credo la penseresti in questo modo se esistesse un sito che pubblicasse informazioni false su di te indicandoti come pedofilo e fosse nel tuo fantastico "ranking" al primo posto nella prima pagina di google e, su tutto il pianeta...ti troverebbero come google vuole che ti trovino.

    COMPLIMENTI.
    Nilok
    1925
  • Quote---
    >Non credo la penseresti in questo modo se esistesse un sito >che pubblicasse informazioni false su di te indicandoti come >pedofilo e fosse nel tuo fantastico "ranking" al primo posto >nella prima pagina di google e, su tutto il pianeta...ti >troverebbero come google vuole che ti trovino.
    ---- end quote

    Questo cosa c'entra?
    Te lo dico io: niente!
    Se esiste un sito con informazioni false, il responsabile di tali falsita' e' il sito, non i motori di ricerca che lo indicizzano (google o altri che siano).

    Se un giornale pubblica un articolo su di te, te la prendi con l'edicolante???

    Fai dei discorsi che non hanno un minimo di senso...
    non+autenticato
  • se per te Apple=Mac stai tranquillo che non lo è per le centinaia di milioni di persone di lingua Anglosassone.

    Se non mi credi vai per le strade di Brisbane e chiedi "Can I've an Apple please?" e guarda se ti regalano un MAC...

    ...ci vado subito pure io...
    Fan Apple
    Nilok
    1925
  • Già fatto...leggiti le altre risposte.

    Ora, cortesemente, che qualcuno mi porti quanche FATTO.

    grazie.
    Nilok
    1925
  • Fatto cosa?
    Hai fatto degli esempi che non solo non stanno in piedi, ma anzi si rivoltano contro le tue stesse elucubrazioni disinformatorie...

    In base a cosa decidi quale sia la pagina che contiene il "la definizione UNIVERSALMENTE riconosciuta della parola mela"? e di tutte le altre parole?

    Dov'e' il "deposito" delle definizioni universalmente riconosciute?

    E Laura Pausini? Il motore deve puntare al tuo deposito di definizione con la sua biografia? Oppure al sito ufficiale?
    Oppure altro?
    non+autenticato
  • Ho capito.

    Forse è possibile anche BREVETTARE dei metodi di indicizzazione...

    Per esempio le "Pagine Gialle" hanno un loro "tree" di indicizzazione per determinare le Categorie Merceologiche, ma la cosa interessane è che questo "tree" sarebbe BREVETTATO (non ho verificato di persona, mi è stato detto da personale interno che lavora in SEAT - Azienda proprietaria delle "Pagine Gialle").

    Certo dovrei andare alla Camera di Commercio o all'Ufficio Brevetti e verificare se è vero. Ma se fosse vero sarebbe la spiegazione più RAZIONALE del "perchè" google, altavista, yahoo e quant'altri non riescono ad indicizzare correttamente le ingormazioni contenute nel Web e di conseguenza a fornire un servizio DECENTE a noi utenti che alle volte arriviamo alla 40esima pagina per trovare qualcosa di utile alla nostra ricerca.
    Nilok
    1925
CONTINUA A LEGGERE I COMMENTI
1 | 2 | 3 | Successiva
(pagina 1/3 - 11 discussioni)