Luca Annunziata

Che cos' un motore di ricerca semantico?

Trovare tutto, prima e meglio. Senza doversi improvvisare maghi delle parole chiave, ma semplicemente domandandolo al computer come fosse un amico o un collega. La promessa della ricerca semantica raccontata da un esperto

Roma - Semantica, semantica, semantica. un po' la moda del momento: sembra che tutto quello che è semantico debba in qualche modo essere bello, vincente. Tim Berners-Lee, papà del web, vorrebbe trasformare tutta Internet in un universo semantico: difficile che ci riesca, ma è indubbio che la tecnologia in questo campo abbia compiuto negli ultimi tempi degli importanti passi in avanti.

Che cos'è un motore semantico?Il problema è che spesso, troppo spesso forse, la parola semantica viene usata per descrivere quanto semantico non è. In altri casi se ne sanciscono invece le doti terapeutiche per qualsiasi problema, di aziende o di privati: "C'è chi la vede come una soluzione miracolosa" spiega Marco Varone, presidente e CTO di Expert System, azienda italiana impegnata da anni nel settore, "mentre altri la definiscono l'ennesima moda che tra poco sarà passata".

Secondo Varone, per l'uomo comune la ricerca semantica significa un passo in avanti significativo: certo non è perfetta, poiché "le sfumature del linguaggio sono infinite", ma consente comunque di "semplificare la gestione della conoscenza non strutturata". Se da una parte ci sono i database, che si manipolano con le tecnologie informatiche tradizionali, dall'altro ci sono i giornali, i documenti, i libri: "Sono risorse non immediatamente accessibili: difficile cercare al loro interno rapidamente, difficile avere accesso con semplicità ai concetti chiave".
La ricerca semantica può colmare questa lacuna, può consentire una "interazione immediata" con i contenuti sfruttando un linguaggio simile al parlato: "non devo imparare ad usarla, ed è possibile ottenere per le mie ricerche risultati più precisi e più ricchi".

Ma che cos'è in effetti la ricerca semantica? Per Varone "è un tentativo di superare quelli che sono i limiti della tecnologia che l'hanno preceduta", vale a dire i motori di ricerca tradizionali (sintattici, come quasi tutti quelli presenti su Internet) che si preoccupano unicamente di "censire" le parole che ci sono all'interno di un testo - le keyword - senza in alcun modo tentare di determinare il contesto in cui queste parole vengono utilizzate. "Ciò tuttavia implica che quando devo andare a cercare certe informazioni devo usare le stesse identiche parole che sono state usate nel documento originale" dice Varone.

La ricerca semantica tenta di invece di avvicinarsi al meccanismo di apprendimento umano: il lettore non memorizza le singole parole, bensì tenta di sviluppare una "mappa cognitiva" che gli consenta di estrarre il significato di quanto sta leggendo. Occorre quindi "analizzare il testo in maniera molto simile a quanto fanno le persone, interpretando il significato logico delle frasi e tentando di carpirne il significato dal contesto". Gli esempi possibili sono innumerevoli: "La parola titolo - chiarisce Varone - si riferisce al titolo di un articolo o ad un BOT?".

Un procedimento di apprendimento complesso, soprattutto per un computer, e solo di recente la tecnologia si è evoluta al punto da renderlo possibile: ma si tratta di una attività che richiede investimenti e capacità, in cui è difficile improvvisare. In realtà quelli della ricerca semantica, dice Varone, sono "obiettivi ambiziosi": occorreranno forse altri 10 anni per consentire lo sviluppo di una tecnologia di ricerca semantica in grado di divenire pervasiva e orizzontale. Allo stato attuale consente di offrire strumenti per compiti precisi: categorizzare la posta elettronica, effettuare ricerche ristrette a settori specifici della conoscenza.

"Oggi non è pensabile un motore di ricerca per tutto il web come Google - prosegue Varone - ma per alcuni settori, quando il problema non è troppo complesso e ci si limita ad un contesto specifico, è possibile implementare soluzioni che consentono di guadagnare tempo e ottenere risultati migliori". Non si tratta neppure di un meccanismo sempre utile o sempre necessario. In alcuni casi, come quando si provi a cercare un personaggio famoso su un motore di ricerca tradizionale, gli attuali risultati sono già più che affidabili: "Se scrivo Britney Spears su Google è evidente che cerco lei e il sito più popolare che la riguarda".
60 Commenti alla Notizia Che cos' un motore di ricerca semantico?
Ordina
  • Conosco Varone perchè leggo il blog (non lo conosco di persona) e 10 giorni fa ha proprio scritto un post in tema sottolineando che erroneamente la semantica viene subito intesa come Semantic Web.
    Consiglio di legger il postSorride
    http://marcovarone.nova100.ilsole24ore.com/2008/03...
    non+autenticato
  • Mi permetto di aggiungere la mia opinione.....
    C'e' prima di tutto un problema di definizioni. Si parla di "semantica" di motori di ricerca semantici, etc.etc.
    Dietro queste parole ci sono spesso cose molto diverse. Abbandoniamo quindi le definizioni e andiamo alla sostanza.

    Non esiste oggi nessuna tecnologia capace di risolvere al 100% problemi di ambiguità del linguaggio e interpretazione semantica. detto questo la scienza sta esplorando surrogati tecnologici che possono aiutare a trattare in modo "intelligente" i contenuti. Il problema è trovare il giusto compromesso tra costo e qualità dei risultati.
    oggi il mondo scentifico sta sempre più andando verso approcci statistici basati su tecniche di machine learning che hanno il vantaggio di costare poco e dare risutlati ottimi.
    L'intepretazione semantica necessita sempre di una contestualizzazione nel dominio specifico e questo costa sempre molto.
    Allora si stanno sviluppando tecnologie capaci di dare un supporto attivo alla ricerca senza dover ricorrere alla semantica.
    Ad esempio in italia www.smartcluster.it è un esempio di motore di ricerca "intelligente" che struttura i risultati creando "on the fly" delle categorie tematiche. Il sito è un demo. Nessuna rete semantica, un processore linguistico, e un meccanismo di clustering basato su tecniche di machine learning.

    Per il web 2.0 presto sarà online sul sito www.openalethes.it un servizio gratutito per l'annotazione semantica dei nostri contenuti in lingua italiana, in primo passo verso un WEB 2.0 automatico.
    -----------------------------------------------------------
    Modificato dall' autore il 27 marzo 2008 15.53
    -----------------------------------------------------------
    -----------------------------------------------------------
    Modificato dall' autore il 27 marzo 2008 15.54
    -----------------------------------------------------------
  • In pratica parli di un categorizzatore dei risultati basato su analisi sintattica. Se lo stesso categorizzatore lo si facesse lavorare su sensi anzichè su parole probabilmente lavorerebbe ancora meglio. E l'utilizzo di metadati con ontologie comuni è ulteriormente integrabile. Ripeto, secondo me tecniche diverse in questo ambito possono essere utilizzate insieme, non sono per forza concorrenti.
  • Infatti sono perfettamente d'accordo.
    Utilizzando queste tecniche in modo gongiuto si possono raggiungere risutlati efficaci
  • Questo discorso della ricerca semantica forse non andrà molto lontano. Quando si pone un problema generico ad un programma sw, questo cade nelle trappole del contesto. Finchè si tratta di vincere una partita a scacchi o mettere a fuoco un volto, il problema è risolvibile via algoritmi, ma quando il contesto non è così chiaro, allora le macchine si perdono.

    Sono almeno venti anni che si studiano algoritmi di traduzione da una lingua ad un'altra, ma i risultati sono risibili. Un testo tradotto da un programma contiene numerosi errori di traduzione, dovuti al fatto che in vent'anni l'intelligenza artificiale ha fatto ben pochi passi...
    non+autenticato
  • la word sense disambiguation e la ricerca nel campo delle ontologie informatiche, servono proprio a superare questo limite.

    Ad oggi, esistono ontologie linguistiche (per esempio wordnet) che permettono, se pur in modo non perfetto, di risalire ad una forma schematizzata sul "significato" delle parole.

    E' proprio questa la sfida dei motori di ricerca semantici. capire il significato delle domande dell'utilizzatore, e restituire risultati che soddisfino la domanda
  • "quando si lavora con un approccio simbolico non cambia molto se la parola usata per dire tavolo è l'inglese table, il tedesco tisch"

    no ma bisogna tenere conto dell'intersezione di piani semantici e ricostruire il dizionario ,il thesaurus o l'ontologia sulla granularità minima, da usare poi sia sull'interrogazione che sul corpus ...

    inoltre alcuni ricercatori svizzeri (mi pare kellerhals e clochard o qualcosa del genere) hanno dimostrato già da diversi anni che possibili incomprensioni di contesto non sono disambiguabili solo con il significato delle parole o l'ausilio di thesauri e marche semantiche, loro
    hanno proposto una specie di skolemizzazione di funzioni-parola per produrre un prototipo (come quello delle funzioni del C) di ogni termine in cui il senso dipende da arità e posizione di altri termini del sintagma, cosa non molto efficiente...

    per non parlare poi dell'evoluzione della lingua e delle derive del processo di produzione di senso per semiosi illimitata, che richiederanno aggiornamenti continui delle definizioni se si vuole trattare davvero il linguaggio naturale

    perciò, imho le ontologie sono promettenti ma sconteranno le strutturali (benchè confinate) limitazioni di dizionario e relazioni controllati e un certo rumore non eliminabile
    non+autenticato
  • Ci sono ricerche volte ad utilizzare ontologie leggere per il word sens disambiguation per ovviare al problema da te desritto dell'evoluzione del linguaggio. Un esempio è l'utilizzo, anzichè di una risorsa lessicale, di wikipedia: il risultato è che lì il linguaggio è molto più "aggiornato". In ogni caso stiamo parlando di tecnologie in cui c'è una grande ricerca e ancora pochi standard, per cui è possibile che ci siano soluzioni migliori di quelle attuali ancora da scoprire, ma il fatto che per ora tutto non funzioni alla perfezione non è sufficiente per demordere, almeno io la penso cosìSorride
  • http://www.quequero.org/Funny_Refs
    Ecco il tipo di domande che la gente pone ai motori di ricerca: ditemi voi se la ricerca semantica non è indispensabile!!!!
  • Cioè la gente deve rimanere ignorante invece è la tecnologia che deve diventare intelligente.
    Bella roba va.
    non+autenticato
  • - Scritto da: kattle87
    > http://www.quequero.org/Funny_Refs
    > Ecco il tipo di domande che la gente pone ai
    > motori di ricerca: ditemi voi se la ricerca
    > semantica non è
    > indispensabile!!!!

    triplo ROTFLA bocca apertaA bocca apertaA bocca aperta
    Ti prego, fai ancora segnalazioni del genere, non riesco a smettere di ridere.
CONTINUA A LEGGERE I COMMENTI
1 | 2 | 3 | Successiva
(pagina 1/3 - 12 discussioni)