Luca Annunziata

FactSpotter, il search engine di Xerox

Mamma Xerox entra nei motori di ricerca, con un prodotto programmato per pensare come un essere umano. Non destinato ai computer degli utenti, non subito almeno, ma punta in alto

Roma - La divisione europea di ricerca di Xerox ha annunciato la disponibilità di un nuovo motore di ricerca semantico che, secondo gli sviluppatori, contribuirà a migliorare la qualità delle ricerche nei documenti d'ufficio.

Tra i punti di forza di FactSpotter una serie di caratteristiche che lo rendono diverso da quanto visto fino ad oggi: l'interfaccia è molto user-friendly, poiché consente di inserire una domanda con un linguaggio il più possibile naturale. Si potrà dire addio a stringhe complicate fatte di segni più e virgolette: basterà chiedere semplicemente quanto si vuole sapere per ottenere una risposta.

Un search engine semantico, a differenza di quelli tradizionali basati su una o più parole chiave, analizza i documenti alla ricerca di informazioni pertinenti l'argomento richiesto dall'utente: le parole immesse come base per la ricerca sono trattate quindi come un argomento su cui basare i risultati, piuttosto che soltanto come elementi di cui individuare la ricorrenza.
In questo modo è possibile interrogare il motore con linguaggio comune, ponendo semplicemente delle domande: il software provvederà ad estrapolare il contesto e restituire tutti i documenti che si riferiscono all'argomento desiderato. Idee non nuove, evidentemente, tutta la differenza la farà l'effettiva efficienza dell'engine.

"Il nostro prodotto va oltre quanto fanno oggi i motori di ricerca basati su keyword o data-mining, che spesso si limitano a fornire solo il 40 percento di tutti i documenti che interessano" ha detto Frédérique Segond, capo della sezione che ha sviluppato FactSpotter: "Lo strumento Xerox è più accurato perché guarda nei documenti, estrae i concetti e li mette in relazione. Intuisce il contesto e fornisce le giuste informazioni all'utente".

Tra le altre caratteristiche di FactSpotter c'è anche la capacità di restituire unicamente la porzione di un file inerente alla domanda posta. Inoltre, il motore indicizza l'intero documento estrapolandone i concetti contenuti, in luogo di limitarsi ad associare soltanto le parole contigue. Non fa neppure distinzione sulla lingua utilizzata, poiché è stato pensato e realizzato per risultare compatibile con un gran numero di grammatiche.

L'engine è anche in grado di allargare la ricerca in modo intelligente: se si cerca un nome di persona, verranno incluse tra i risultati anche le frasi in cui ci si riferisce in terza persona o con un pronome al soggetto. Oppure la ricerca di concetti astratti come "palazzo" o "figura geometrica", verrà ampliata per contenere i termini grattacielo, villa, cerchio, quadrato, triangolo ecc.

"Oggi chi lavora con i documenti ha un bel problema davanti. Ogni giorno cerchiamo informazioni e dati precisi, per fare bene il nostro lavoro" dice Mike Maziarka, direttore di InfoTrends Dynamic: "Abbiamo tutti bisogno di strumenti che ci semplifichino i compiti, che ci permettano di trovare l'ago nel pagliaio della massa di informazioni che esistono oggi. FactSpotter risponde a questa esigenza, (...) aumentando la produttività".

A quanto pare però, i navigatori non potranno mettere le mani su FactSpotter molto presto: nelle intenzioni di Xerox il nuovo motore verrà incorporato inizialmente soltanto nei suoi prodotti pensati per consulenti legali, per poi essere messo a disposizione anche di medici, istituti bancari e finanziari, operatori di marketing.

Al momento non è previsto alcuno sbarco sulla rete, anche se esistono già degli strumenti simili pensati per il web. Chissà se, come ipotizza TechCrunch, prima o poi non arriverà lo Steve Jobs di turno a strappare FactSpotter dalle mani di Xerox per trasformarlo nella sua fortuna.

Luca Annunziata
4 Commenti alla Notizia FactSpotter, il search engine di Xerox
Ordina
  • se si chiamava "trovafatti" al massimo se lo comprava il sert...
    non+autenticato
  • Hanno capito fin da subito che su web non avrebbero avuto storia. E' difficile ormai arrivare ai livelli di google. Forse come applicazione potrebbe funzionare benone.

    Secondo me sti concetti di interpretare cosa cerca l'utente sono fallati in partenza se non ben supportati.
    Sul web puoi analizzare quanti hanno cliccato un risultato al posto di un altro e quindi si può stabilire una maggiore attendibilità di un documento rispetto ad un altro.
    Lato applicazione si rischia di dare all'utente quasi sempre quello che non vuole.
  • Beh, esempi di motori di ricerca semantici che funzionano ce ne sono vari.
    Come scritto prima, al momento funzionano solo all'interno di specifici settori di conoscenza e professionali, e dopo un'adeguata istruzione. Ma una volta messo a punto i risultati sono ottimi. Il web è troppo generico per queste applicazioni.
    Btw, una delle aziende leader del settore è italiana.
    -----------------------------------------------------------
    Modificato dall' autore il 26 giugno 2007 13.48
    -----------------------------------------------------------
  • Mi sembra una ottima idea nei campi ove si disponga di contenuti quanto più organici e omogenei tra di loro (l'esempio della medicina e del settore legale calza a pennello: basta pensare a milioni di pagine di casi clinici o documentazione processuale).
    Solo che il web non è un libro di testo e l'informazione è talmente eterogenea che una ricerca di questo tipo non farebbe altro che restringere i risultati.
    non+autenticato