Un iper-software per studiare la Shoah

Un programmone di IBM e di due università lavorerà su 51mila interviste video sulla Shoah, per renderle più accessibili ai ricercatori. L'idea è realizzare un motore di ricerca video poliglotta. Un progettone-monster

Un iper-software per studiare la ShoahWeb - Il lavoro è imponente ma lo scopo è ambizioso: la costruzione di un software capace di ricercare gli elementi contenuti in 51mila interviste video sulla Shoah. Materiale ritenuto essenziale per lo studio di uno dei più drammatici eventi nella storia dell'umanità.

A guidare il progettone di ricerca e la realizzazione di una tecnologia capace di rispondere a queste esigenze è IBM, che collabora con la John Hopkins University e l'Università del Maryland.

I documenti che questo software dovrà saper trattare sono costituiti da interviste a sopravvissuti e testimoni dell'olocausto, racconti personalissimi di quello che è stato e che proprio per questo rappresentano una memoria fondamentale per l'umanità. La creazione del software è finanziata anche dalla National Science Foundation americana, che ha disposto un fondo di 7,5 milioni di dollari per questo obiettivo.
A fornire i documenti è in particolare la Fondazione per la storia visuale della Shoah, un'organizzazione che dispone del più ampio archivio di racconti sulla Shoah, per un totale di circa 116mila ore di interviste già poste su supporto digitale. Interviste realizzate in 32 diverse lingue e provenienti da 57 diversi paesi.

"Il nostro obiettivo principale - ha spiegato il presidente della Shoah Foundation Doug Greenberg - quello di raccogliere 50mila testimonianze è ora completo. La nostra missione adesso è utilizzare questo archivio per educare e per superare il pregiudizio".

La necessità di costruire un software specifico è nata dall'esperienza. I ricercatori hanno infatti già iniziato a indicizzare manualmente i contenuti delle singole interviste, segnalando tempi, luoghi ed eventi descritti. Ma si tratta di un lavoro enorme. Con 8 milioni di dollari la Shoah Foundation è riuscita a catalogare soltanto 4mila di quelle interviste.

L'idea di fondo è quella di costruire un'applicazione di riconoscimento vocale che possa portare alla realizzazione di un motore di ricerca vocale. L'elemento più difficile, naturalmente, è quello di cercare di far digerire al sistema così tante lingue e persino dialetti diversi. Un altro problema è che spesso il parlato è di difficile interpretazione, sia per la cattiva qualità del supporto originale su cui le interviste sono state registrate, sia per la forte emozione che molti dei testimoni dimostrano e che incide sulla chiarezza.

Imbarcarsi in un progetto tecnologicamente così avanzato e difficile è evidentemente un forte investimento per le imprese coinvolte, IBM in primo luogo, e per i ricercatori. Riuscire a mettere a punto un "indicizzatore" di documenti video poliglotta, infatti, significherebbe aprire un intero mercato di nuovi progetti e applicazioni possibili.
TAG: mondo