Che cos'è un motore di ricerca semantico?

Aggiungi Punto Informatico come Fonte preferita su Google

Semantica , semantica , semantica. È un po’ la moda del momento: sembra che tutto quello che è semantico debba in qualche modo essere bello, vincente. Tim Berners-Lee, papà del web, vorrebbe trasformare tutta Internet in un universo semantico: difficile che ci riesca, ma è indubbio che la tecnologia in questo campo abbia compiuto negli ultimi tempi degli importanti passi in avanti .

Che cos'è un motore semantico? Il problema è che spesso, troppo spesso forse, la parola semantica viene usata per descrivere quanto semantico non è. In altri casi se ne sanciscono invece le doti terapeutiche per qualsiasi problema, di aziende o di privati: “C’è chi la vede come una soluzione miracolosa” spiega Marco Varone, presidente e CTO di Expert System , azienda italiana impegnata da anni nel settore, “mentre altri la definiscono l’ennesima moda che tra poco sarà passata”.

Secondo Varone, per l’uomo comune la ricerca semantica significa un passo in avanti significativo: certo non è perfetta, poiché “le sfumature del linguaggio sono infinite”, ma consente comunque di “semplificare la gestione della conoscenza non strutturata “. Se da una parte ci sono i database, che si manipolano con le tecnologie informatiche tradizionali, dall’altro ci sono i giornali, i documenti, i libri : “Sono risorse non immediatamente accessibili: difficile cercare al loro interno rapidamente, difficile avere accesso con semplicità ai concetti chiave”.

La ricerca semantica può colmare questa lacuna , può consentire una “interazione immediata” con i contenuti sfruttando un linguaggio simile al parlato: “non devo imparare ad usarla, ed è possibile ottenere per le mie ricerche risultati più precisi e più ricchi”.

Ma che cos’è in effetti la ricerca semantica? Per Varone “è un tentativo di superare quelli che sono i limiti della tecnologia che l’hanno preceduta”, vale a dire i motori di ricerca tradizionali (sintattici, come quasi tutti quelli presenti su Internet) che si preoccupano unicamente di “censire” le parole che ci sono all’interno di un testo – le keyword – senza in alcun modo tentare di determinare il contesto in cui queste parole vengono utilizzate. “Ciò tuttavia implica che quando devo andare a cercare certe informazioni devo usare le stesse identiche parole che sono state usate nel documento originale” dice Varone.

La ricerca semantica tenta di invece di avvicinarsi al meccanismo di apprendimento umano : il lettore non memorizza le singole parole, bensì tenta di sviluppare una “mappa cognitiva” che gli consenta di estrarre il significato di quanto sta leggendo. Occorre quindi “analizzare il testo in maniera molto simile a quanto fanno le persone, interpretando il significato logico delle frasi e tentando di carpirne il significato dal contesto”. Gli esempi possibili sono innumerevoli: “La parola titolo – chiarisce Varone – si riferisce al titolo di un articolo o ad un BOT?”.

Un procedimento di apprendimento complesso, soprattutto per un computer, e solo di recente la tecnologia si è evoluta al punto da renderlo possibile : ma si tratta di una attività che richiede investimenti e capacità, in cui è difficile improvvisare. In realtà quelli della ricerca semantica, dice Varone, sono “obiettivi ambiziosi”: occorreranno forse altri 10 anni per consentire lo sviluppo di una tecnologia di ricerca semantica in grado di divenire pervasiva e orizzontale . Allo stato attuale consente di offrire strumenti per compiti precisi: categorizzare la posta elettronica, effettuare ricerche ristrette a settori specifici della conoscenza.

“Oggi non è pensabile un motore di ricerca per tutto il web come Google – prosegue Varone – ma per alcuni settori, quando il problema non è troppo complesso e ci si limita ad un contesto specifico, è possibile implementare soluzioni che consentono di guadagnare tempo e ottenere risultati migliori”. Non si tratta neppure di un meccanismo sempre utile o sempre necessario. In alcuni casi, come quando si provi a cercare un personaggio famoso su un motore di ricerca tradizionale, gli attuali risultati sono già più che affidabili : “Se scrivo Britney Spears su Google è evidente che cerco lei e il sito più popolare che la riguarda”. Implementare un motore di ricerca semantico, peraltro, non è neppure una procedura semplice: “Richiede molto lavoro per adattarlo ad ogni lingua e cultura – racconta Varone – quando si lavora con un approccio simbolico non cambia molto se la parola usata per dire tavolo è l’inglese table , il tedesco tisch “. Se subentra la tecnologia semantica, ecco che il computer necessita di essere istruito: “L’aspetto linguistico conta perché gli stessi oggetti si possono indicare con termini differenti; e poi ci sono concetti che non esistono neppure in culture differenti, o che vengono indicati con parole diverse”.

I passaggi fondamentali per costruire un motore semantico non sono molti. Prima di tutto occorre “capire che tipo di informazione deve essere trattato”, vale a dire quale tipo di conoscenza debba essere gestita: manuali di auto, programmi tv etc. Occorre inoltre specificare come queste informazioni verranno ricercate: “Voglio una informazione precisa e puntuale o informazioni generiche? Sono passaggi poco semantici ma molto importanti”.

A questo punto si passa alla parte operativa: al software va data in pasto tutta la conoscenza del sistema, in modo da permettergli di individuare concetti ed espressioni problematiche: “In un manuale automobilistico alcuni concetti come volante, sedile, cambio, saranno conosciuti e riconoscibili: ma in un sito che parla di persone e show televisivi, i titoli di questi ultimi potrebbero risultare un problema”. Per questo al meccanismo di autoapprendimento si affianca la presenza dei tecnici, che risolvono i dubbi del software “integrando” la sua conoscenza.

Infine c’è la “messa a punto”. Si mette alla prova il sistema con domande vere o simulate, cercando di individuare quali siano i punti forti e i punti deboli della struttura: “Non è una tecnologia perfetta – puntualizza Varone – a volte ci sono cose che vanno meno bene di altre, ad esempio se ci si esprime per metafore divento tutto più complicato”. Ma mettendo alla frusta quanto realizzato è possibile tentare di tarare il servizio sulle reali esigenze del cliente, ottimizzandone il funzionamento.

Il risultato è un nuovo modo di interrogare i computer in cerca di conoscenza: “Mentre in un motore normale dovrei dire lampadina fanale posteriore , con un sistema semantico posso chiedere come faccio a sostituire la lampadina del fanale posteriore? “. Il sistema in questo caso è in grado di di riconoscere il contesto e individuare l’informazione desiderata: “Posteriore, dietro, sono la stessa cosa nel linguaggio naturale, e tali restano per un motore semantico. Lo stesso vale per lampada e lampadina”. Con un motore di ricerca classico non sarebbe la stessa cosa, mentre in questo caso “non è l’utente che si deve preoccupare di trovare la parola giusta, è il sistema che si preoccupa di concettualizzare”. I possibili utilizzi della tecnologia di ricerca semantica sono moltissimi: “Non posso dire molto – si schermisce Varone – stiamo lavorando con diverse realtà ma sono tutte in stealth mode . Quello che posso dire è che ad esempio stiamo lavorando su pubblicità mirate sui contenuti: analizzando il testo della pagina si individuano i concetti chiave e si scelgono in un catalogo i messaggi che si addicono ai contenuti”. Niente più pubblicità contestuale completamente slegata dalla pagine web in cui compare: “È un concetto innovativo, che è in avanzata fase di sperimentazione”.

In modo simile, anche l’ assistenza tecnica può avvantaggiarsi della ricerca semantica: “Prendiamo i telefonini, un prodotto complesso che le persone utilizzano tutti i giorni, ma che spesso sfruttano all’un per cento delle loro reali possibilità”. Invece di doversi portare dietro il manuale per studiare e memorizzare le procedure di accesso alle singole funzioni, potrebbe bastare un semplice SMS per ottenere una guida in linea puntuale: “Anche questa è una sperimentazione avviata e che funziona bene: i nostri clienti sono soddisfatti e dalle nostre prove è emerso che nell’85 per cento dei casi il sistema capisce la domanda e risponde in modo appropriato”.

Niente più code al call center, niente risposte poco precise da operatori poco preparati: sarebbe un bel passo in avanti per gli utenti. Certo ci sono anche categorie che potranno trarre minor vantaggio dalla ricerca semantica: è il caso degli scienziati e delle pubblicazioni a contenuto tecnico scientifico. “In questo caso – spiega Varone – si va in un contesto da addetti ai lavori, e questi ultimi riescono a sfruttare e a far fruttare meglio anche le tecnologie più semplici: sono abituati ad usare il lessico di settore, e sono abituati a consultare grosse quantità di materiale per documentarsi”.

Anche in questo caso, comunque, gli esempi di applicazione non mancano: “Abbiamo realizzato un sistema pensato per i medici di famiglia, nel quale inserire i sintomi del paziente per ottenere i medicinali adatti alla cura – secondo la letteratura medica analizzata ovviamente”. Un sistema che non è adatto agli specialisti: “C’è ancora tanto da fare, da migliorare in questo settore: non è un argomento facile, ed è difficile trovare tecnici competenti”.

Expert System è una azienda italiana – “siamo ben contenti di esserlo” – ma per reperire le risorse dotate delle skill giuste non esita a rivolgersi all’estero: “Abbiamo personale di tutto il mondo, vengono da Ungheria, Danimarca, Francia. Trovare giovani competenti è complicato, la formazione italiana a livello universitario è molto semplificata e in declino: trovare persone che capiscano di semantica non è facile – conclude – anche se il fatto che vada di moda un po’ aiuta”.

a cura di Luca Annunziata

Luca Annunziata

Pubblicato il 27 mar 2008

Link copiato negli appunti

Ti potrebbe interessare

Luca Annunziata

Pubblicato il
27 mar 2008

Link copiato negli appunti