Newbie.it/ Motori di ricerca, zig zag nel caos

Dal sito dedicato ai neofiti della Rete una veloce descrizione di cosa sono e come funzionano i motori di ricerca, come inserirvi il proprio sito, come sapere chi ha segnalato il sito

Newbie.it - Il motore di ricerca è un sito basato su un programma molto complesso in grado di fornire indicazioni precise su come raggiungere le informazioni richieste dall'utente.

Esistono sulla rete un'infinità di motori di ricerca più o meno grandi, alcuni dei quali si sono specializzati su un particolare settore (es. immagini, mp3, etc), altri invece riescono ad offire al loro pubblico un'infinità di servizi aggiuntivi come negozi elettronici e traduttori istantanei, ma la loro funzionalità principale, che attira un gran numero di visitatori (e quindi anche di pubblicità), rimane la ricerca gratuita delle informazioni.

Attualmente i motori di ricerca ricoprono un ruolo assolutamente indispensabile: sono la principale fonte per la ricerca di informazioni su Internet poiché sono gli unici a disporre di immensi database di siti faticosamente aggiornati nel tempo. Queste strutture però, raccolgono solo una piccola percentuale dei siti presenti sul web (stime dicono circa 1/4) e non sono ancora in grado di fornire una risposta precisa per ogni ricerca, pertanto sono allo studio tecnologie superiori che riusciranno, si spera, a fornire all'utente solo i documenti di cui ha bisogno (nel minor tempo possibile) attingendo da una banca dati sempre più vasta.
Un Search Engine (trad. in inglese) è quindi un grande database di singole pagine che compongono un sito web, e diventa dunque parecchio importante sceglierlo anche in base a quello che si desidera trovare. Infatti, una volta che abbiamo fornito le parole "chiave", il motore effettua automaticamente per noi una scansione dei suoi dati, verificando la presenza delle parole inserite dall'utente nell'insieme delle pagine di cui dispone (e nelle parole di descrizione, dette "keyword", che il webmaster inserisce per indicizzare al meglio il suo sito sul motore).

Da un punto di vista più tenico, il software del motore di ricerca è composto da 3 blocchi di lavoro:

- Spider, in italiano "ragno", un software capace di catalogare i siti sottoposti al motore dagli utenti, ma sopratutto in grado di navigare autonomamente sulla rete alla ricerca di documenti non ancora archiviati. Lo spider segue la struttura dei link di un sito e, ogni volta che incontra un collegamento ad un'altra pagina, archivia il documento e segue il link successivo, disegnando in maniera decisamente capillare una mappa della rete piuttosto precisa (per quello che può esserlo una realtà così dinamica!) ed ampliando notevolmente il numero di pagine presenti nel database.

- DataBase, una struttura elettronica compatta in grado di contenere in maniera organizzata ed ordinata tutte le informazioni raccolte dallo spider. Da questa struttura vengono estratte le informazioni elencate a video quando si esegue una ricerca.

- Indice, il componente di interfaccia tra il software e l'utente finale, infatti contiene i riferimenti alle informazioni presenti nel database; l'organizzazione strutturale di questo componente diventa dunque di fondamentale importanza relativamente ai tempi di ricerca che devono essere quasi immediati.

A livello hardware invece, si tratta di strutture decisamente complesse e performanti.
TAG: italia
10 Commenti alla Notizia Newbie.it/ Motori di ricerca, zig zag nel caos
Ordina
  • Non è valido per tutti, ma per esempio looksmart dà chiare indicazioni... che sono anche abbastanza ovvie... però non per tutti... ti dicono più o meno "non far perdere tempo alla gente":

    Con che criterio selezionano i siti, i redattori di LookSmart ?

    Noi non includiamo mai:

    Pornografia o siti solo per adulti
    Siti con pubblicità pornografica o per adulti
    Siti con violenza gratuita
    Siti che promuovano o diffondano attività illegali
    Siti che non sono in inglese (!!! bastardi!! )
    Siti che vendono medicine ...

    Noi possiamo escludere:

    Siti con troppo poche pagine (!!! credevo con troppe!)
    Siti senza riconoscibile contenuto di qualità
    Siti che sono smodatamente lenti da caricare
    Siti che non sono usufruibili ad un pubblico degli Stati Uniti

    Noi stiamo cercando:

    Siti che siano ricchi in contenuto originale
    Sitiche sono attinenti al lavoro, benessere o divertimento attinenti a casa e occupazione

    In particolare, noi preferiamo Siti che sono:


    Di Qualità alta
    Affidabili e moderni
    Accurati
    Facili da usare
    Veloci
    che usino linguaggio corrente
    Unici nel contenuto
    Interessanti
    Belli a vedersi
    Utili ai consumatori (e questo mi scazza... perché non "utenti"?) ... consumatori...


    ciao e spero di avervi dato qualche dritta...
    ... anche se sono cose ovvie
    non+autenticato
  • mi ricordo che su Altavista una volta ho letto questo, relativamente alle proposte di inserimento dei siti:

    Meta tag are not a magic keyword
    Meta tag are not a magic keyword
    Meta tag are not a magic keyword
    Meta tag are not a magic keyword
    Meta tag are not a magic keyword

    scritto esattamente così.
    non+autenticato
  • Una volta AltaVista aveva la stupenda funzione del "refine" ... una cosa stupenda.

    Riusciva da una prima ricerca a dirti in 10 categorie, in percentuale, di cosa trattavano i siti che aveva trovato. qualsiasi fosse il numero delle pagine.

    tu eliminavi direttamente quelle categorie che avevi identificato come inutili...
    e così restringendo sempre più il campo in fasi successive... funzionava da Dio.

    infatti lo hanno tolto. Sorride

    se qualcuno sa qualcosa di lui o di motori che facciano la stessa cosa... me lo dica qui su PI ...sarà utile a tutti.   :-L
    non+autenticato
  • mi va tutto bene fino a

    "infatti contiene i riferimenti alle informazioni presenti nel database; l'organizzazione strutturale di questo componente diventa dunque di fondamentale importanza relativamente ai tempi di ricerca che devono essere quasi immediati."
    ok, sintatticamente non fa una piega... ma ... non capisco comunque cosa sia l'indice!

    "
    A livello hardware invece, si tratta di strutture decisamente complesse e performanti."

    PERFORMANTI??!!!
    mi sa tanto da italianizzazione... che vuol dire?
    su http://www.garzanti.it/ non esiste quella parola.
    non+autenticato
  • I motori di ricerca, ultimamente hanno grossi
    problemi di inserimento nuovi siti.
    Il tempo indicato all'iscrizione di un sito
    non e' mai rispettato.
    Alcuni esempi:
    Altavista.it/.com - 3 mesi di attesa
    Lycos - 2 mesi
    Virgilio - 2,5 mesi dopo varie sollecitazioni
    Sara' il boom di Internet, ma queste attese
    dovrebbero essere almeno indicate.

    non+autenticato
CONTINUA A LEGGERE I COMMENTI
Successiva
(pagina 1/2 - 7 discussioni)