Luca Annunziata

Skype contro la Torre di Babele

Un sistema di traduzione consecutiva automatico. Integrato nel software per le videochiamate VoIP. Sarà realtà a partire dalla fine del 2014

Roma - Alla mente torna subito il traduttore universale di Star Trek, o il Babelfish della Guida Galattica: quanto mostrato da Microsoft, tramite la sua controllata Skype sul palco della conferenza statunitense Code è la realizzazione di quello che fino a pochi anni fa era solo una speculazione della fantascienza. Il CEO Satya Nadella, assieme al collega Gurdeep Pall che sovrintende alla messagistica per Microsoft, ha mostrato al pubblico quello che ha chiamato "Skype Translator": un sistema di intelligenza artificiale che ascolta, traduce e ripete in un'altra lingua come in un intepretariato consecutivo, con una precisione non paragonabile (almeno in questa demo, senza dubbio pure ampiamente preparata e sperimentata) a quella di un professionista umano, ma comunque in grado di garantire il passaggio dell'informazione.


Il traduttore miracoloso è frutto della collaborazione tra Microsoft Research e il team Skype: stando alle parole di Nadella la tecnologia mostrata è oggetto di studio e sviluppo da almeno un decennio, ma solo ora con il progressivo ampliamento delle capacità computazionali e la ampia disponibilità del cloud computing per supportare il funzionamento in remoto del motore di traduzione è stato possibile renderla disponibile al pubblico. Qualcosa di simile è già disponibile nelle API per la traduzione del testo presenti in Azure, ma la possibilità di applicare lo stesso meccanismo in tempo reale a una conversazione audio-video ha naturalmente richiesto uno sforzo ulteriore di integrazione.

Sul piano della ricerca, dai laboratori di Pechino spiegano che un grosso è stato fatto naturalmente nell'addestramento del motore che comprende e traduce nelle diverse lingue. Non solo si è badato al parlato, ma anche alle forme di espressione scritta tipiche di ambienti informali come i social network. Mettendo assieme questi studi, un meccanismo di riconoscimento del parlato molto sofisticato, alcune ricerche relative alla pronuncia dei fonemi e applicando a tutto una rete neurale in grado di apprendere progressivamente nuove capacità (modellata sulle recenti tendenze multi-livello - DNN: deep neural network - per farla assomigliare nella sua concezione al cervello umano), il risultato è quanto mostrato sul palco californiano: un sistema chiaramente ancora imperfetto, ma impressionante nella sua capacità di offrire quantomeno una traduzione comprensibile nel senso a due interlocutori parlanti inglese e tedesco.

Tornando alla pratica, e agli affari, Redmond non perde l'occasione per spiegare come questa idea di Skype Translator non sia altro che un esempio del nuovo approccio One Microsoft: il riconoscimento del parlato è già stato reimpiegato per lo sviluppo di Cortana, l'assistente vocale di Windows Phone 8.1, e la tecnologia sviluppata da Microsoft Research ha trovato un valido supporto per affinarne le capacità nel team Skype. Non era la prima volta che questi algoritmi venivano mostrati al pubblico, il loro debutto ufficiale è avvenuto nel 2012, ma l'integrazione in un prodotto destinato al pubblico sarebbe il punto di svolta che per Microsoft significa che il prodotto è davvero pronto.

Skype Translator sarà distribuito come app in beta entro la fine del 2014, per ora in esclusiva su Windows 8 e versioni successive del sistema desktop. In seguito saranno realizzate anche versioni specifiche per tutte le piattaforme su cui Skype è già disponibile, anche se in questo caso non è dato conoscere quali saranno i tempi effettivi di sviluppo.

Luca Annunziata


14 Commenti alla Notizia Skype contro la Torre di Babele
Ordina
  • E se la traduzione si avvalesse di un passaggio intermedio qual'è l'Esperanto, anche la traduzione inglese ci guadagnerebbe.
    non+autenticato
  • > E se la traduzione si avvalesse di un passaggio
    > intermedio qual'è l'Esperanto, anche la
    > traduzione inglese ci
    > guadagnerebbe.

    No, è un mito degli esperantisti.
    Le traduzioni dirette sono sempre le migliori, ovviamente se il software che esegue l'operazione è all'altezza, e capita di rado.
    Le traduzioni che passano attraverso l'inglese sembrano migliori solo perché i software che fanno una traduzione diretta con lingue meno utilizzate in informatica fanno pena.
  • Il primo che riesce a fare un sistema efficace , MS , Google , Apple , IBM, sbanca il mercato
    non+autenticato
  • Allo stato attuale le uniche traduzioni decenti (anche se in questo caso decenti è una parola grossa) possono essere inglese-xxx e yyy-inglese (ci sono molti casi in cui cui il senso della frase viene completamente capovolto. Tutte le traduzioni trasversali xxx-yyy e yyy-xxx dire che sono ridicole è un eufemismo. Da almeno 4/5 anni comunico in russo ed in cinese non solo per diletto con grande stupore degli interlocutori) ma è un utilizzo di Google translate abbastanza trasversale. Purtroppo l'inglese non ha molte sfumature come altre lingue e questo castra la traduzione in partenza.
    non+autenticato
  • - Scritto da: prova123
    > Allo stato attuale le uniche traduzioni decenti
    > (anche se in questo caso decenti è una parola
    > grossa) possono essere inglese-xxx e yyy-inglese
    > (ci sono molti casi in cui cui il senso della
    > frase viene completamente capovolto. Tutte le
    > traduzioni trasversali xxx-yyy e yyy-xxx dire che
    > sono ridicole è un eufemismo. Da almeno 4/5 anni
    > comunico in russo ed in cinese non solo per
    > diletto con grande stupore degli interlocutori)
    > ma è un utilizzo di Google translate abbastanza
    > trasversale. Purtroppo l'inglese non ha molte
    > sfumature come altre lingue e questo castra la
    > traduzione in
    > partenza.

    Per fortuna l'inglese non ha molte sfumature più o meno cervellotiche di altre lingue meno adatte ad una comprensione universale!
    Per il resto sono daccordo.

    L'errore di base di M$ o chi per lei si cimenta sull'argomento è quello di voler rincorrere le incongruenze, le imprecisioni, i doppi sensi, per non parlare di assurdi modi di dire e e circonlocuzioni ed espressioni relative ad ambiti locali o addirittura dialettali che comopongono, purtroppo lo dico io, il volgarissimo linguaggio correntemente parlato o cinguettato o twittato o bloggato magari da tanti giovani o giovinastri pressochè estranei ad ogni forma di accuratezza di espressione se non proprio di cultura (quelli che per scopare intendono tutt'altro che spazzare)...
    Ben diverso è il linguaggio corretto ed accuratamente espresso per evitare ogni forma di ambiguità, e solo su questa precisa base è possibile creare un software decente o quanto meno non ridicolo.

    Facendo esempio sulla lingua nostrana: anche se correttamente parlata, se non viene ristrutturata allo scopo come logica vuole, troppe sono le ambiguità; e finchè cazzotto significa anche piccolo pene e la z di questo sostantivo ha una fonetica diversa dalla z di zanzara (provate ad invertirle e vi farete una risata), e finchè non c'è nessuno indica la stessa cosa di non c'è alcuno anzichè il suo opposto, la vedo proprio dura raggiungere un risultato credibile o almeno non ridicolo da parte di queste presunte intelligenzze artificiali universali al servizio di improbabili traduzioni live automatiche continue.

    Anche il più perfetto software di traduzione confonderebbe la frase La carne è debole, lo spirito è forte con l'altra frase famosa La bistecca è tenera, l'alcool è di elevata gradazione...

    Così come è la realtà, la struttura delle varie lingue volgarmente parlate è solo un gran casino (ovvero un grande piccolo caso).
    -----------------------------------------------------------
    Modificato dall' autore il 29 maggio 2014 03.06
    -----------------------------------------------------------
  • Provate a guardare questa azienda qui:
    Expert System http://www.expertsystem.net

    Vi assicuro che il loro software capisce le ambiguità della lingua italiana meglio di un qualunque diplomato italiano individuando tutta la struttura logica del testo ed i significati delle parole in relazione al contesto.

    Tra 4 o 5 anni il traduttore non sarà più un umano. Sono pronto a scommetterci.
    non+autenticato
  • > Provate a guardare questa azienda qui:
    > Expert System http://www.expertsystem.net
    >
    > Vi assicuro che il loro software capisce le
    > ambiguità della lingua italiana meglio di un
    > qualunque diplomato italiano individuando tutta
    > la struttura logica del testo ed i significati
    > delle parole in relazione al contesto.

    Ci sono dimostrazioni pratiche su frasi da sottoporre?
  • - Scritto da: rockroll

    > Per fortuna l'inglese non ha molte sfumature più
    > o meno cervellotiche di altre lingue meno adatte
    > ad una comprensione
    > universale!
    > Per il resto sono daccordo.
    >

    Ok, ma quando si ha a che fare con "you" che vale sia per "tu" che per "voi" diventa estramente più complicato tradurre in lingue meno semplici, in quanto in generale se ho due lingue l'informazione che non c'è/è ambigua in una non è traducibile per definizione.
    non+autenticato
  • No: ascolta, traduce in testo, archivia, traduce nella lingua desiderata e ripete.

    Google starà rosicando di questa trovata per carpire i fatti altrui!
    ruppolo
    33147
  • - Scritto da: ruppolo
    > No: ascolta, traduce in testo, archivia, traduce
    > nella lingua desiderata e
    > ripete.
    >
    > Google starà rosicando di questa trovata per
    > carpire i fatti
    > altrui!

    Se era apple invece ?
  • - Scritto da: Sg@bbio
    > - Scritto da: ruppolo
    > > No: ascolta, traduce in testo, archivia, traduce
    > > nella lingua desiderata e
    > > ripete.
    > >
    > > Google starà rosicando di questa trovata per
    > > carpire i fatti
    > > altrui!
    >
    > Se era apple invece ?

    A me sembra tanto che sia lui a rodersi il fegato.
  • - Scritto da: Sg@bbio
    > - Scritto da: ruppolo
    > > No: ascolta, traduce in testo, archivia, traduce
    > > nella lingua desiderata e
    > > ripete.
    > >
    > > Google starà rosicando di questa trovata per
    > > carpire i fatti
    > > altrui!
    >
    > Se era apple invece ?

    Se era Apple nessun problema, loro i soldi li fanno in altro modo.
    ruppolo
    33147
  • - Scritto da: ruppolo

    > > Se era apple invece ?
    >
    > Se era Apple nessun problema, loro i soldi li
    > fanno in altro
    > modo.

    E se batti le scarpette rosse tre volte, arrivano le scimmie volanti e ti esprimono un desiderio!Con la lingua fuori
    Funz
    12975
  • - Scritto da: ruppolo
    > No: ascolta, traduce in testo, archivia, traduce
    > nella lingua desiderata e
    > ripete.
    >

    Ma neanche.

    Ascolta, (forse) comprime e invia a casa, proprio lì, nel cloud.

    Dopo tutto è preferibile elaborare nelle mega server farm remote invece che nei terminali, per altro già sufficientemente impegnati a tracciare l'utente.

    Poi il risultato (opportunamente backuppato, sempre nel cloud, sempre per il nostro bene) viene restituito al cliente (il tuo [i|andro]coso).

    Aspetta... Adesso che ci penso un paradigma simile esiste già: si chiama Siri, forse ne avrai sentito parlare.