Alfonso Maruccia
mercoledì 19 novembre 2008

Il PageRank sviscerato. O quasi

Una live chat su Google Gruppi svela qualche particolare in più sull'algoritmo che serve a calcolare quanto pesa una pagina web nell'indice del motore di ricerca più usato della rete

Roma - Google PageRank ha qualche segreto in meno: in una sessione di Q&A del gruppo Google Webmaster Help tenutasi negli ultimi giorni di ottobre, Matt Cutts, Maile Ohye e altri Google-man hanno risposto alle domande dell'utenza e (appunto) dei webmaster riguardo alcune questioni spigolose sulle modalità di ranking delle pagine web adoperate nell'algoritmo matematico più celebre di Internet.

La sessione non ha portato alla pubblicazione di nulla di trascendentale, né d'altronde PageRank è in sé portatore di verità universali ignote ai più, visto che è un marchio brevettato e documentato. Tuttavia le risposte collezionate sono servite a sciogliere certi dubbi su quello che realmente conta per scalare le classifiche di gradimento del mega-cervellone matematico di Google. E per contribuire a generarne altri, a dirla tutta.

Tra le risposte più interessanti vi è ad esempio quella che assicura il mantenimento del PageRank delle pagine anche in caso di errori HTML 301, vale a dire un redirect permanente dell'URL verso una nuova destinazione. Il PageRank rimane identico anche in caso di redirect ricorsivi, ma considerando che lo standard HTML 1.0 ne concede al massimo 5 in serie è il caso di non esagerare.Il PageRank viene poi calcolato in maniera diversa all'interno di ogni ecosistema linguistico quando i contenuti vengono tradotti, dicono gli uomini di Google, e su questo probabilmente non occorreva una Q&A per fugare gli eventuali dubbi in proposito. L'algoritmo di ricerca negli indici di Mountain View viene modificato spesso? E quanto spesso? "Tanto" è la prevedibile risposta, lo scorso anno i tweak sono ammontati a oltre 450.

Conta la velocità con cui una pagina viene caricata nel calcolo del PageRank? Sì, probabilmente conta parecchio, anche se i Google-man non lo dicono in maniera esplicita. Così come affermano, tra le righe, che se il post di un blog ha tanti commenti viene classificato prima nei risultati di ricerca e che meno link sono presenti su un sito più gli URL di destinazione dei detti link varranno all'interno degli indici calcolati sulla base di PageRank.

Tra le considerazioni che meno risultano chiare vi è la questione sul "se" e "se sì, quanto" l'età virtuale di un sito web influenza la sua posizione all'interno delle ricerche. In questo caso i G-man prima sostengono che "sì, se il tuo dominio è stato credibile per anni la cosa può aiutare" e che acquistare un nuovo dominio, trasferirvi i propri contenuti e sperare di avere lo stesso PageRank di sempre è mera utopia. Poi, però, contraddicendo quanto espresso in precedenza rivelano che "nella maggioranza dei casi la cosa non ha importanza, perché vogliamo presentare le migliori informazioni, non solo quelle più vecchie".

Alfonso Maruccia
33 Commenti alla Notizia Il PageRank sviscerato. O quasi
Ordina
  • Moltissimi siti - che sono visitatissimi - vengono snobbati da Google e non figurano nemmeno nei suoi indici eppure la gente ci va senza bisogno di passare da Google.

    Ci sono moltissime cose che si possono far fare a Google ma una di quelle è di far saltare fuori dei bugs colossali che nemmeno gli sviluppatori della "formula del PR" riescono a vedere per quanto la loro intelligenza (?) è di tipo eccessivamente settoriale, scarsamente euristica e prevalentemente algoritmica...

    L'impressione è che in casa Google difendano la segretezza di una formula per evitare il crollo dei loro affari.
    non+autenticato
  • Esempio di sito "visitatissimo" che è snobbato da Google?

    Newbie, inesperto
    non+autenticato
  • E' semplicissimo:

    Inserisci nella pagina il tuo codice fiscale. Lascia che google passi e poi cerca quello.
    za73
    109
  • Capito tutto sul discorso eh! =) Qui si parla del fatto che se una persona QUALSIASI cerca un termine QUALSIASI tipo "casa", il primo sito (o tra i primi) sia quello che una DETERMINATA azienda (ad esempio di affitti) vuole far trovare (ovvero il suo)...quindi l'azienda deve SMARONARSI (termine tecnico eh) per riuscire a far si che il suo PageRank incrementi e surclassi altri siti in modo che se "Gigi" cerca "casa" gli viene fuori tra i primi risultati "azienda affitti tal dei tali"...ovvio che un codice specifico mi restituisce un solo risultato che è pure il primo...
    non+autenticato
  • - Scritto da: individuo
    > far si che il suo PageRank incrementi e surclassi
    > altri siti in modo che se "Gigi" cerca "casa" gli
    > viene fuori tra i primi risultati "azienda
    > affitti tal dei tali"

    Il pr conta quasi 0 per i risultati delle serp.
    non+autenticato
  • Questo non è il PageRank...
    non+autenticato
  • Cosa sarebbe l'errore HTML 301?

    Forse stiamo parlando dello "Status code HTTP 301" ?

    idem per "lo standard HTML 1.0 ne concede al massimo 5 in serie"

    Forse si intende il protocollo HTTP/1.0 (che tra l'altro non usa più quasi nessuno, nemmeno PI) ?
    non+autenticato
  • massì, tu lasciali parlare.. tanto anche se scrivono cavolaggini non se ne accorge nessuno!
    non+autenticato
  • - Scritto da: pippo scopa
    > massì, tu lasciali parlare.. tanto anche se
    > scrivono cavolaggini non se ne accorge
    > nessuno!
    Perdonaci signore supremo onnisapiente... perchè non ti fai assumere in redazione cosi ci liberi da questo strato di ignoranza? -.-
    non+autenticato
  • In effetti conosco un metodo, ma ovviamente non intendo dirveloSorride

    Invece, vi posso dire che credo si tratti di un piccola falla, funziona nel 5%-7% dei casi, ma se vi mettete d'impegno su 100 tentativi prima o poi ne azzeccate qualcuno.

    Il sito si innalza a PR7 in 3 settimane, a volte 4, per poi venir bannato (off course...).

    Chi di voi ha sperimentato?
    non+autenticato
  • Sperimentato cosa?? Il metodo che non intendi rivelare?
    In effetti, anche io conosco un metodo che..... bla bla bla Con la lingua fuori
    non+autenticato
  • Io a mio padre che e' fissato col page rank dei suoi siti gli ho detto in continuazione di pubblicare, cioe' di usare quel form che ti permette di proporre un url a google, le sue pagine con novita' e di ricercare sempre il proprio sito tramite google e di cliccarci per vederselo.
    Sara' forse un metodo stupido da piano piano funziona, ovviamente avendone + di 1 di siti internet tutti sono molto linkati tra di loro e poi il metodo di ricercare il proprio sito sul motore di ricerca l'ha diffusa ai suoi amici.
    Personalmente non me ne frega proprio nulla del page rank, sono per la filosofia del "meno siamo meglio stiamo!" perche' se putacaso un sito internet viene preso d'assalto poi, se e' gratuito te lo chiudono, e cmq diventa lentissimo da vedere cioe' proprio l'opposto del suo scopo = non essere chiuso per eccesso di traffico ed essere sempre veloce nel visitarlo.
  • Uhm.. Pochi concetti ma ben confusi...
    non+autenticato
  • Non essendo i miei son contentoSorride
  • - Scritto da: Super_Treje

    > Personalmente non me ne frega proprio nulla del
    > page rank, sono per la filosofia del "meno siamo
    > meglio stiamo!" perche' se putacaso un sito
    > internet viene preso d'assalto poi, se e'
    > gratuito te lo chiudono, e cmq diventa lentissimo
    > da vedere cioe' proprio l'opposto del suo scopo =
    > non essere chiuso per eccesso di traffico ed
    > essere sempre veloce nel
    > visitarlo.

    Sarà mica perché il tuo sito non ha scopo di lucro?
    non+autenticato
  • Sono semplici siti personali tutto qui.
  • - Scritto da: Super_Treje
    > Io a mio padre che e' fissato col page rank dei
    > suoi siti gli ho detto in continuazione di
    > pubblicare, cioe' di usare quel form che ti
    > permette di proporre un url a google, le sue
    > pagine con novita' e di ricercare sempre il
    > proprio sito tramite google e di cliccarci per
    > vederselo.

    Hai detto una cavolata mostruosaSorride
    il PR è influenzato dai link mica dalle visite, il tu sito può avere 1 milione di visite ma pr nullo o 0, se vuoi alzare il tuo pr crea del contenuto interessante e sarai linkato. STOP.

    Poi per il discorso di uscire primo nei risultati il PR conta ma davvero poco.
    non+autenticato
  • Io non ho detto come funziona il PR io ho detto riportato cio' che ho visto, e' ben diverso credoSorride
  • > Hai detto una cavolata mostruosaSorride
    > il PR è influenzato dai link mica dalle visite,
    > il tu sito può avere 1 milione di visite ma pr
    > nullo o 0, se vuoi alzare il tuo pr crea del
    > contenuto interessante e sarai linkato.

    Opinabile. Mai sentito parlare dell'algoritmo di Rocchio e simili?
    non+autenticato
  • - Scritto da: Alfredo

    > Hai detto una cavolata mostruosaSorride
    > il PR è influenzato dai link mica dalle visite,
    > il tu sito può avere 1 milione di visite ma pr
    > nullo o 0, se vuoi alzare il tuo pr crea del
    > contenuto interessante e sarai linkato.
    > STOP.

    Mah. Sei sicuro di quanto affermi?
    Un sito con Pr4 puo' essere tale sia perche' e' ben collegato da altri siti, sia perche' e' molto visitato da altri utenti ( e come fare per farlo sapere a Google è abbastanza semplice...basta inserire il suo codice per le statistiche all'interno delle pagine ).
    Inoltre un altro fattore del PR è dato dal numero di click che ottiene il tuo sito quando viene effettuata una ricerca ed il tuo sito risulta nell'elenco dei possibili risultati.

    Insomma, il PR non si basa solo sul numero di siti che ti linkano, altrimenti tra directory, siti di amici, siti personali, siti di lavoro, ognuno avrebbe PR 10.

    > Poi per il discorso di uscire primo nei risultati
    > il PR conta ma davvero
    > poco.

    Non e' il PR che conta, ma tutti i fattori che aiutano ad avere un alto numero di PR a far si che il tuo sito sia ben posizionato.
    Se segui tutte le regole idonee per ottenere un buon posizionamento, avrai sia un buon posizionamento che un buon PR ( anche in assenza di "molti" link dall'esterno ).
    non+autenticato
 

La soluzione ideale per Security and Video Managed: le innovazioni Cisco.

Programmare con Ajax

Programmare con Ajax

Ajax è celebrato da più parti come una delle novità più eclatanti degli ultimi anni. È grazie ad Ajax che oggi si parla con sempre maggiore convinzione del Web 2.0. Ma di cosa si [...]