Armonk (USA) – Alzi la mano chi utilizza con assiduità i comandi vocali del proprio telefono cellulare. Probabilmente pochi, e questo perché le tecnologie di riconoscimento vocale oggi implementate nei piccoli dispositivi sono in genere poco efficienti e spesso inutili. Ma IBM promette ora una piccola rivoluzione.
Big Blue ha infatti commercializzato una nuova tecnologia per il riconoscimento della voce che, a suo dire, permette di controllare un computer di bordo o un device palmare avvalendosi del linguaggio naturale : ciò significa che l’utente non sarà più obbligato a memorizzare i comandi pre-registrati nel dispositivo, né a scandire lentamente le singole parole.
Big Blue fa l’esempio di un utente alle prese con il sintonizzatore radio della propria auto: con le tecnologie attuali l’automobilista sarebbe obbligato a cambiare stazione articolando, ad esempio, le parole “radio 104.3 FM”. Con il nuovo sistema, l’utente potrebbe semplicemente dire “vai su 104.3”, “sintonizzati su 104.3” o, ancora, “cambia la stazione su 104.3”. In qualsiasi caso, il dispositivo sarebbe in grado di comprendere il senso della frase e cambiare la stazione radio.
Il colosso di Armonk ha dimostrato come questo sistema possa essere utilizzato per controllare diverse funzioni di un’auto, come player CD, climatizzatore e navigatore satellitare, oppure per eseguire una transazione bancaria dal telefono cellulare.
Questa capacità è merito di quella che IBM chiama freeform command recognition , una funzionalità che utilizza avanzate tecniche di analisi semantica e modellazione statistica del linguaggio per interpretare correttamente l’ordine e il significato delle parole.
Ma questi sofisticati algoritmi servirebbero a poco se, come spesso accade oggi, l’utente fosse obbligato a ripetere più volte i comandi per via dei rumori di fondo. A tal proposito IBM afferma di aver ulteriormente migliorato la propria tecnologia così da renderla efficace anche in presenza di forte rumore , come quello della strada, dei clacson o di un treno.
“Negli scorsi anni il riconoscimento vocale ha raccolto molte critiche, ma nel frattempo è maturato in una tecnologia davvero utile e pronta per un secondo avvento”, ha affermato Jim Holland, product line manager Embedded Speech dell’IBM Software Group: “La possibilità di utilizzare il linguaggio naturale per comandare un dispositivo permette alle persone di sfruttare le tecnologie mobili rimanendo concentrati sui compiti che richiedono la massima attenzione, come guidare o attraversare la strada”.
IBM conta di vendere la propria tecnologia, che fa parte della nuova versione 4.4 di Embedded ViaVoice, sia ai produttori di dispositivi palmari che a quelli di sistemi di navigazione per le auto. Tra le prime società ad aver preso licenza del nuovo software c’è VoiceBox, che la adotterà all’interno di una piattaforma embedded per la navigazione e la ricerca di informazioni.