Misurato il Web italiano!

C'è lo storico motore de IlTrovatore dietro una misurazione che non ha precedenti e che stima in 48 milioni le pagine web offerte da domini .it. Ecco i dettagli della presenza italiana su web

Misurato il Web italiano!Roma - Per la prima volta, grazie a tecnologie specifiche sviluppate dallo storico motore di ricerca e indice di siti web Il Trovatore, è stato possibile quantificare le "dimensioni" del Web italiano. Un dato che finora è mancato pur a fronte di numerose e diverse analisi sulla presenza dei materiali italiani sulla rete internet.

"Gli spider de IlTrovatore - si legge in una nota diffusa ieri dalla società -hanno rilevato la presenza di ben 48 milioni di pagine Web, tra statiche e dinamiche, tutte appartenenti a siti con dominio.it."

Le pagine web generate in modo dinamico, in continua crescita, spesso e volentieri non vengono calcolate dagli spider web mentre IlTrovatore sostiene di aver potuto tenere conto anche del loro numero. Anzi, afferma di rappresentare in questo senso una "unica eccezione nel panorama dei motori di ricerche", scoprendo così che "il Web italiano è ben più vasto di quanto si pensasse".

In particolare, gli spider de IlTrovatore hanno evidenziato che il cosiddetto Web dinamico supera di gran lunga quello statico. Nel mese di settembre, infatti, IlTrovatore ha rilevato la presenza nel Web italiano di ben 30 milioni di pagine dinamiche e di circa 16 milioni di pagine statiche.
Dalla fotografia scattata da IlTrovatore sul Web Italiano nel mese di settembre è inoltre emerso che:

- esistono circa 16 milioni di pagine statiche, cioè le pagine con estensione.htm o.html;
- sono 32 milioni le pagine dinamiche, ossia quelle costruite nei contenuti in base alle istruzioni specificate dall'utente (come quelle di Punto Informatico);
- sono 84.000 le pagine Web che cambiano posizione in maniera permanente da un mese all'altro, mentre 500.000 hanno un redirect verso un altro sito;
- 30.000 mila pagine Web richiedono la password per l'accesso;
- circa 700.000 mila sono i "File not Found" (l'errore HTTP 404) in un mese;
- circa 50.000 pagine Web danno origine all'"Internal server Error";
- circa 60.00 pagine sono raggiungibili tramite un link ma ne è vietato l'accesso (Forbidden).

IlTrovatore, uno dei pionieri del web italiano, è disponibile qui.
TAG: italia
16 Commenti alla Notizia Misurato il Web italiano!
Ordina
  • Un motore di ricerca che mi apre 2 popup quando lo carico finisce irrimediabilmente tra le risorse che meno utilizzerò quando sono online.

    Al di là di questo, non vedo l'utilità della ricerca effettuata.
    Non mi sembra molto significativo prendere in considerazione i soli domini .it per affermare che "quella" è la fetta rappresentativa del web italiano.
    La lingua utilizzata mi sembra + appropriato.
    Esistono infatti una molteplicità di siti che utilizzano altri domini, persino .cc, e la lingua utilizzata è l'italiano.
    Altri ancora sono italiani ma sono in lingua inglsese, o magari sono presenti + versioni dello stesso sito in lingue diverse.
    Ripeto: francamente non vedo l'utilità della cosa..
    non+autenticato
  • E la legge della new-economy e dei portali vi farà chiudere!
    non+autenticato
  • Non e' detto che una pagina con estensione .html sia necessariamente statica: si puo' benissimo configurare Apache per fargli leggere il codice PHP anche all' interno di una pagina con estensione .html (o qualsiasi altra estensione).
    non+autenticato
  • Certo, posso configurare Apache come meglio credo. Ad ogni modo, nella configurazione di default, ovvero nella stragrande maggioranza dei casi, le estensioni .htm e html corrispondo a pagine statiche. E' chiaro che posso settare gli AddHandler come voglio, ma molti non lo fanno.
    Tanto è vero che molti siti php dai motori di ricerca non sono nemmeno presi in considerazione.

    - Scritto da: Garak
    > Non e' detto che una pagina con estensione
    > .html sia necessariamente statica: si puo'
    > benissimo configurare Apache per fargli
    > leggere il codice PHP anche all' interno di
    > una pagina con estensione .html (o qualsiasi
    > altra estensione).
    non+autenticato
  • I Signori forse dimenticano la marea di siti in lingua italiana ma con estensione .com scelta al 99% perchè molto meno "burocratica" da ottenere. Fax? MA che fax? Lettere di responsabilità? E cosa sono?

    non+autenticato
  • Salve,
    Non abbiamo dimenticato le pagine italiane sotto dominio .com. La ricerca,infatti, come chiaramente riportato, si riferisce ai soli siti registrati nel dominio .it.

    - Scritto da: Minnie
    > I Signori forse dimenticano la marea di siti
    > in lingua italiana ma con estensione .com
    > scelta al 99% perchè molto meno
    > "burocratica" da ottenere. Fax? MA che fax?
    > Lettere di responsabilità? E cosa sono?
    >
    non+autenticato
  • Appunto. Se la ricerca è limitata ai .it non vuol forse dire che vi siete dimenticati del .com
    Forse era meglio una ricerca sui siti in lingua italiana, qualsiasi estensione essi possano avere.
    non+autenticato
  • Minnie scrive:
    >Appunto. Se la ricerca è limitata ai .it non vuol >forse dire che vi siete dimenticati del .com
    >Forse era meglio una ricerca sui siti in lingua >italiana, qualsiasi estensione essi possano >avere.

    Cara Minnie, è impossibile fare una ricerca su tutti i siti in lingua italiana con tutti i suffissi, capito? Che ne sai quanti siti ci sono in lingua italiana con suffisso .fi (finlandesi) con suffisso .de (tedeschi) con suffisso .es (spagnoli)??
    non+autenticato


  • - Scritto da: Hamlet
    > Minnie scrive:
    > >Forse era meglio una ricerca sui siti in
    > lingua >italiana, qualsiasi estensione essi
    > possano >avere.
    >
    > Cara Minnie, è impossibile fare una ricerca
    > su tutti i siti in lingua italiana con tutti
    > i suffissi, capito?

    Se selezioni "Pagine in Italiano" con Google, ti trova i siti in lingua italiana, indipendentemente dall'estensione.

    Se ci riesce, vuol dire che e' possibile farlo!
    non+autenticato
  • Beh, allora non puoi dire di aver musurato tutto il web italiano. E come se x misurare il mercato dell'auto in Italia contrassi solo quelli che hanno modelli nazionali. E quelli che girano in BMW o Renault?

    Io ho registrato a mio nome 12 domini, nemmeno uno è .it



    non+autenticato


  • - Scritto da: IlTrovatore

    > Non abbiamo dimenticato le pagine italiane
    > sotto dominio .com. La ricerca,infatti, come
    > chiaramente riportato, si riferisce ai soli
    > siti registrati nel dominio .it.

    Allora non e' il "Web Italiano"!

    E' il Web del dominio .IT

    Per Web Italiano, io intendo tutti i siti in italiano riguardanti cose o persone italiane.
    non+autenticato
  • ...chiederlo a Google? Che è da anni che indicizza anche le pagine dinamiche (asp, php, etcc..) e adesso anche i PDF(!)????
    non+autenticato
  • .... Goggole in italiano.
    non+autenticato
  • Salve,
    Nonostante l'indiscutibile efficienza di Google, il noto motore di ricerca non attualmente in grado di coprire in modo esaustivo i siti nel dominio .it. Da nostri test, infatti, è risultato che il database di Google, per quanto concerne i siti .it, contiene circa un terzo delle pagine indicizzate da IlTrovatore.
    Il test, verificabile da tutti in prima persona, consiste nell'effettuare la ricerca di un qualsiasi termine limitandola ai siti .it.
    Ad esempio:
    Keyword Roma
    Risultati:
    Google: Google ha cercato roma site:.it nell'intera rete mondiale.    Risultati 1 - 10 di circa 106,000
    IlTrovatore: pagine 1284064, siti 27727


    - Scritto da: mah
    > ...chiederlo a Google? Che è da anni che
    > indicizza anche le pagine dinamiche (asp,
    > php, etcc..) e adesso anche i PDF(!)????
    non+autenticato
  • - Scritto da: IlTrovatore
    > Salve,
    > Nonostante l'indiscutibile efficienza di
    > Google, il noto motore di ricerca non
    > attualmente in grado di coprire in modo
    > esaustivo i siti nel dominio .it.

    Mmmm... ho provato a cercare il nome di mia Moglie (per le graduatorie di insegnamento): virgilio trova un sito, il trovatore no.

    Quindi non lo bookmarco.Ficoso
    non+autenticato


  • - Scritto da: IlTrovatore
    > Salve,
    > Nonostante l'indiscutibile efficienza di
    > Google, il noto motore di ricerca non
    > attualmente in grado di coprire in modo
    > esaustivo i siti nel dominio .it

    Ho fatto due prove cercando innanzitutto il mio nome e cognome, e poi il titolo di uno dei siti che ho fatto, col vostro motore e con Google (selezionando "cerca pagine in italiano").

    Ovviamente ho trovato cio' che cercavo solo con Google, dato che entrambi i siti sono registrati sotto .COM.

    Non voglio certo mettere in dubbio l'efficenza del vostro motore, per giudicare la quale ci vorrebbero ben piu' di un paio di prove al volo, giudico semplicemente errata la scelta di classificare i siti in base all'estensione di dominio.

    Quando un utente medio cerca un "sito italiano" se ne frega dell'estensione, cerca semplicemente un sito nella sua lingua.

    Ecco perche' in questo caso Google ha funzionato meglio, ha scelto il criterio giusto di classificazione.

    non+autenticato