Luca Annunziata
giovedì 27 marzo 2008

Che cos'è un motore di ricerca semantico?

Trovare tutto, prima e meglio. Senza doversi improvvisare maghi delle parole chiave, ma semplicemente domandandolo al computer come fosse un amico o un collega. La promessa della ricerca semantica raccontata da un esperto

Implementare un motore di ricerca semantico, peraltro, non è neppure una procedura semplice: "Richiede molto lavoro per adattarlo ad ogni lingua e cultura - racconta Varone - quando si lavora con un approccio simbolico non cambia molto se la parola usata per dire tavolo è l'inglese table, il tedesco tisch". Se subentra la tecnologia semantica, ecco che il computer necessita di essere istruito: "L'aspetto linguistico conta perché gli stessi oggetti si possono indicare con termini differenti; e poi ci sono concetti che non esistono neppure in culture differenti, o che vengono indicati con parole diverse".

I passaggi fondamentali per costruire un motore semantico non sono molti. Prima di tutto occorre "capire che tipo di informazione deve essere trattato", vale a dire quale tipo di conoscenza debba essere gestita: manuali di auto, programmi tv etc. Occorre inoltre specificare come queste informazioni verranno ricercate: "Voglio una informazione precisa e puntuale o informazioni generiche? Sono passaggi poco semantici ma molto importanti".

A questo punto si passa alla parte operativa: al software va data in pasto tutta la conoscenza del sistema, in modo da permettergli di individuare concetti ed espressioni problematiche: "In un manuale automobilistico alcuni concetti come volante, sedile, cambio, saranno conosciuti e riconoscibili: ma in un sito che parla di persone e show televisivi, i titoli di questi ultimi potrebbero risultare un problema". Per questo al meccanismo di autoapprendimento si affianca la presenza dei tecnici, che risolvono i dubbi del software "integrando" la sua conoscenza.
Infine c'è la "messa a punto". Si mette alla prova il sistema con domande vere o simulate, cercando di individuare quali siano i punti forti e i punti deboli della struttura: "Non è una tecnologia perfetta - puntualizza Varone - a volte ci sono cose che vanno meno bene di altre, ad esempio se ci si esprime per metafore divento tutto più complicato". Ma mettendo alla frusta quanto realizzato è possibile tentare di tarare il servizio sulle reali esigenze del cliente, ottimizzandone il funzionamento.

Il risultato è un nuovo modo di interrogare i computer in cerca di conoscenza: "Mentre in un motore normale dovrei dire lampadina fanale posteriore, con un sistema semantico posso chiedere come faccio a sostituire la lampadina del fanale posteriore?". Il sistema in questo caso è in grado di di riconoscere il contesto e individuare l'informazione desiderata: "Posteriore, dietro, sono la stessa cosa nel linguaggio naturale, e tali restano per un motore semantico. Lo stesso vale per lampada e lampadina". Con un motore di ricerca classico non sarebbe la stessa cosa, mentre in questo caso "non è l'utente che si deve preoccupare di trovare la parola giusta, è il sistema che si preoccupa di concettualizzare".
60 Commenti alla Notizia Che cos'è un motore di ricerca semantico?
Ordina
  • Conosco Varone perchè leggo il blog (non lo conosco di persona) e 10 giorni fa ha proprio scritto un post in tema sottolineando che erroneamente la semantica viene subito intesa come Semantic Web.
    Consiglio di legger il postSorride
    http://marcovarone.nova100.ilsole24ore.com/2008/03...
    non+autenticato
  • Mi permetto di aggiungere la mia opinione.....
    C'e' prima di tutto un problema di definizioni. Si parla di "semantica" di motori di ricerca semantici, etc.etc.
    Dietro queste parole ci sono spesso cose molto diverse. Abbandoniamo quindi le definizioni e andiamo alla sostanza.

    Non esiste oggi nessuna tecnologia capace di risolvere al 100% problemi di ambiguità del linguaggio e interpretazione semantica. detto questo la scienza sta esplorando surrogati tecnologici che possono aiutare a trattare in modo "intelligente" i contenuti. Il problema è trovare il giusto compromesso tra costo e qualità dei risultati.
    oggi il mondo scentifico sta sempre più andando verso approcci statistici basati su tecniche di machine learning che hanno il vantaggio di costare poco e dare risutlati ottimi.
    L'intepretazione semantica necessita sempre di una contestualizzazione nel dominio specifico e questo costa sempre molto.
    Allora si stanno sviluppando tecnologie capaci di dare un supporto attivo alla ricerca senza dover ricorrere alla semantica.
    Ad esempio in italia www.smartcluster.it è un esempio di motore di ricerca "intelligente" che struttura i risultati creando "on the fly" delle categorie tematiche. Il sito è un demo. Nessuna rete semantica, un processore linguistico, e un meccanismo di clustering basato su tecniche di machine learning.

    Per il web 2.0 presto sarà online sul sito www.openalethes.it un servizio gratutito per l'annotazione semantica dei nostri contenuti in lingua italiana, in primo passo verso un WEB 2.0 automatico.
    -----------------------------------------------------------
    Modificato dall' autore il 27 marzo 2008 15.53
    -----------------------------------------------------------
    -----------------------------------------------------------
    Modificato dall' autore il 27 marzo 2008 15.54
    -----------------------------------------------------------
  • In pratica parli di un categorizzatore dei risultati basato su analisi sintattica. Se lo stesso categorizzatore lo si facesse lavorare su sensi anzichè su parole probabilmente lavorerebbe ancora meglio. E l'utilizzo di metadati con ontologie comuni è ulteriormente integrabile. Ripeto, secondo me tecniche diverse in questo ambito possono essere utilizzate insieme, non sono per forza concorrenti.
  • Infatti sono perfettamente d'accordo.
    Utilizzando queste tecniche in modo gongiuto si possono raggiungere risutlati efficaci
  • Questo discorso della ricerca semantica forse non andrà molto lontano. Quando si pone un problema generico ad un programma sw, questo cade nelle trappole del contesto. Finchè si tratta di vincere una partita a scacchi o mettere a fuoco un volto, il problema è risolvibile via algoritmi, ma quando il contesto non è così chiaro, allora le macchine si perdono.

    Sono almeno venti anni che si studiano algoritmi di traduzione da una lingua ad un'altra, ma i risultati sono risibili. Un testo tradotto da un programma contiene numerosi errori di traduzione, dovuti al fatto che in vent'anni l'intelligenza artificiale ha fatto ben pochi passi...
    non+autenticato
  • la word sense disambiguation e la ricerca nel campo delle ontologie informatiche, servono proprio a superare questo limite.

    Ad oggi, esistono ontologie linguistiche (per esempio wordnet) che permettono, se pur in modo non perfetto, di risalire ad una forma schematizzata sul "significato" delle parole.

    E' proprio questa la sfida dei motori di ricerca semantici. capire il significato delle domande dell'utilizzatore, e restituire risultati che soddisfino la domanda
  • "quando si lavora con un approccio simbolico non cambia molto se la parola usata per dire tavolo è l'inglese table, il tedesco tisch"

    no ma bisogna tenere conto dell'intersezione di piani semantici e ricostruire il dizionario ,il thesaurus o l'ontologia sulla granularità minima, da usare poi sia sull'interrogazione che sul corpus ...

    inoltre alcuni ricercatori svizzeri (mi pare kellerhals e clochard o qualcosa del genere) hanno dimostrato già da diversi anni che possibili incomprensioni di contesto non sono disambiguabili solo con il significato delle parole o l'ausilio di thesauri e marche semantiche, loro
    hanno proposto una specie di skolemizzazione di funzioni-parola per produrre un prototipo (come quello delle funzioni del C) di ogni termine in cui il senso dipende da arità e posizione di altri termini del sintagma, cosa non molto efficiente...

    per non parlare poi dell'evoluzione della lingua e delle derive del processo di produzione di senso per semiosi illimitata, che richiederanno aggiornamenti continui delle definizioni se si vuole trattare davvero il linguaggio naturale

    perciò, imho le ontologie sono promettenti ma sconteranno le strutturali (benchè confinate) limitazioni di dizionario e relazioni controllati e un certo rumore non eliminabile
    non+autenticato
  • Ci sono ricerche volte ad utilizzare ontologie leggere per il word sens disambiguation per ovviare al problema da te desritto dell'evoluzione del linguaggio. Un esempio è l'utilizzo, anzichè di una risorsa lessicale, di wikipedia: il risultato è che lì il linguaggio è molto più "aggiornato". In ogni caso stiamo parlando di tecnologie in cui c'è una grande ricerca e ancora pochi standard, per cui è possibile che ci siano soluzioni migliori di quelle attuali ancora da scoprire, ma il fatto che per ora tutto non funzioni alla perfezione non è sufficiente per demordere, almeno io la penso cosìSorride
  • http://www.quequero.org/Funny_Refs
    Ecco il tipo di domande che la gente pone ai motori di ricerca: ditemi voi se la ricerca semantica non è indispensabile!!!!
  • Cioè la gente deve rimanere ignorante invece è la tecnologia che deve diventare intelligente.
    Bella roba va.
    non+autenticato
  • - Scritto da: kattle87
    > http://www.quequero.org/Funny_Refs
    > Ecco il tipo di domande che la gente pone ai
    > motori di ricerca: ditemi voi se la ricerca
    > semantica non è
    > indispensabile!!!!

    triplo ROTFLA bocca apertaA bocca apertaA bocca aperta
    Ti prego, fai ancora segnalazioni del genere, non riesco a smettere di ridere.
CONTINUA A LEGGERE I COMMENTI
1 | 2 | 3 | Successiva
(pagina 1/3 - 12 discussioni)