Gaia Bottà

Simon ti ascolta. Parlaci

Riconosce la voce dell'utente e la traduce in comandi impartiti alla macchine. E' multipiattaforma, è gratuito, è open source ed è solo il capostipite di una nuova generazione di tool

Roma - La scena dei software assistivi di riconoscimento vocale si arricchisce del progetto simon. Di impronta open source, basato su strumenti pre-esistenti, simon è tutto da costruire ma già consente di utilizzare un computer articolando i comandi con l'uso della voce. Una funzionalità disponibile da anni su vari sistemi ma che ora potrebbe trovare una maggiore attenzione tra gli sviluppatori: c'è chi spera che possa tradursi in una chiave di volta per le interfacce vocali.

L'interfaccia di SimonÈ stato progettato con l'intento di supportare un ragazzino disabile, per consentirgli di interfacciarsi con un computer senza dover utilizzare i tradizionali dispositivi di input. I sistemi di riconoscimento vocale attualmente in uso non sono adatti a ritagliarsi sulle esigenze di persone con problemi motori: oltre ad essere costosi, sono spesso costruiti su tecnologie proprietarie, sono poco flessibili e non si prestano ad essere modificati affinché assolvano a compiti aggiuntivi.

Simon è invece multipiattaforma, il codice è pubblicato su SourceForge e rilasciato sotto licenza GPL. Simon agirà da raccordo tra Julius e HTK Toolkit. Il primo consiste in un motore per il riconoscimento vocale in grado di cogliere non solo parole, ma sequenze di parole espresse in linguaggio naturale: spezza un flusso vocale in fonemi, le cui combinazioni possono essere interpretate e tradotte in comandi. HTK Toolkit gestisce invece l'apprendimento del sistema.
Per correlare il linguaggio verbale a delle parole, invece, simon consentirà di importare strutture grammaticali e vocabolari da Wiktionary, trascrizioni audio per allenare il sistema dal catalogo di VoxForge. L'interfaccia utente è ora in tedesco, ma alcuni sviluppatori stanno provvedendo alla traduzione in inglese, affinché simon possa essere utilizzato da un pubblico più ampio.

Per ora il progetto è stato rilasciato in alfa, la versione non è stabile né integra tutte le funzioni previste. È un punto di partenza sul quale lavorare, un progetto che ha raccolto l'interesse di molti, tanto che nei prossimi mesi parteciperà a ICCHP, la conferenza internazionale che raccoglie quanto di più innovativo c'è sulla scena della tecnologie assistive.

Gaia Bottà
23 Commenti alla Notizia Simon ti ascolta. Parlaci
Ordina
  • Speech-2-Text: c'è

    un mattoncino in più per la fortezza leeenuks!
    non+autenticato
  • - Scritto da: Dan Arcy Menon
    > Speech-2-Text: c'è
    >
    > un mattoncino in più per la fortezza leeenuks!

    premetto che amo e adoro linux, ma non sara' mai un OS per uso desktop. troppo complicato (e lento) ancora per gli utonti.

    ciaoSorride
    non+autenticato
  • Lento? in che senso?
  • è leeeeeento, invece Vista è una scheggia!
    non+autenticato
  • - Scritto da: flagg
    > è leeeeeento, invece Vista è una scheggia!

    Rotola dal ridere
    non+autenticato
  • - Scritto da: flagg
    > è leeeeeento, invece Vista è una scheggia!

    strano, in genere le schegge si ficcano in un occhio, questa invece mi è rimasta sullo stomacoA bocca aperta
    non+autenticato
  • probabilmente è abituato alle distro server (magari configurate per avere tipo 15 minuti di avvio ma poi un macigno che nn si impalla più [stile unix])

    Comunque non sono d'accordo sul "MAI" perchè potrebbe benissimo essere tra cent'anni

    E in informatica cent'anni sono sei mesi (la cadenza di rilascio della Ubuntu Occhiolino)
    non+autenticato
  • "lento" nel senso che la grafica gira in un sistema client-server che nel 99% dei casi girano entrambi sulla stessa macchina, quindi non se ne possono apprezzare le qualita' di flessibilita'.
    La grafica di windows, invece, gira nativa nel ring 0 del kernel windows, proprio per ridurre le latenze e migliorare la responsivita'. Il problema e' che in win si congela la grafica, il pc deve essere resettato, invece in linux si "butta giu'" la sessione grafica con ctrl-alt-backspace ma sotto linux continua a girare tranquillamente.

    Certo, poi win necessita di harware piu' prestante rispetto a linux, ma questo attiene al modo pasticciato in cui e' stato sviluppato win.
    non+autenticato
  • > Certo, poi win necessita di harware piu'
    > prestante rispetto a linux, ma questo attiene al
    > modo pasticciato in cui e' stato sviluppato
    > win.


    appunto, quindi il vantaggio di avere la GUI a ring 0 dove sta se poi non si lavora per ottimizzare il sottosistema grafico?
    non+autenticato
  • - Scritto da: pabloski
    > > Certo, poi win necessita di harware piu'
    > > prestante rispetto a linux, ma questo attiene al
    > > modo pasticciato in cui e' stato sviluppato
    > > win.
    >
    >
    > appunto, quindi il vantaggio di avere la GUI a
    > ring 0 dove sta se poi non si lavora per
    > ottimizzare il sottosistema
    > grafico?

    l'interfaccia grafica su windows (a parità di effetti) è molto più veloce e reattiva, poi siete liberi di sparare stronzate a vita pur di difendere l'indifendibile (almeno sotto questo punto di vista)
    non+autenticato
  • Win è proprio un fulmine di guerra quanto a reattività ?!!!A bocca apertaA bocca apertaA bocca apertaA bocca apertaA bocca aperta
    non+autenticato