L’Intelligenza è artificiale, ma in molti casi l’orecchio è umano: solo così Amazon può assicurare un rapido ed efficace percorso di crescita all’assistente Alexa, ossia affiancando il machine learning ad un insegnamento proveniente non soltanto da una molteplicità di dati, ma anche dalla verifica che migliaia di persone in tutto il mondo stanno facendo a partire dagli estratti audio registrati dal servizio. Quel che Google, Facebook e altri gruppi fanno con la registrazione continua dei testi che portiamo online, Amazon lo fa con i comandi vocali impartiti verso i dispositivi Echo: un’inchiesta fa ora luce sui meccanismi che regolano questo tipo di lavoro, lasciando emergere una forte componente umana dietro i progressi che troppo semplicemente sono stati fin qui accreditati alla bontà dell’IA.
L’uomo ascolta, Alexa impara
Amazon intende essere trasparente nel modo in cui Alexa sta imparando ad ascoltare, parlare e interpretare il linguaggio umano: lo fa spiegando chiaramente a Bloomberg come i dispositivi Echo catturino tracce audio provenienti dagli utenti, le vadano ad archiviare in remoto e quindi il tutto sia (in alcuni casi) analizzato da orecchie umane che ascoltano, interpretano e verificano quanto appreso dal sistema. Questo processo ha lo scopo di velocizzare l’apprendimento di una lingua da parte di Alexa: il lungo percorso che può portare milioni di input a determinare una regola al servizio dell’Intelligenza Artificiale, può essere accorciato se un intervento umano si pone in aiuto dell’elaborazione computazionale.
Il team al lavoro su questa funzione è operativo in tutto il mondo, su più lingue, e comprende una commistione di dipendenti del gruppo e risorse umane esterne. Per tutti si tratta di ascoltare brevi estratti, riportandone quindi testo e significato al sistema affinché possa confrontare la propria interpretazione con quella dell’elemento umano. Si tratta di un lavoro da portare avanti per circa 9 ore al giorno, durante le quali vengono ascoltate ed appuntate circa 1000 clip audio (i numeri ben esplicano quanto veloce debba essere tale lavoro di analisi e registrazione: per ogni clip occorrono circa 30 secondi di lavoro).
[gallery_embed id=88385]
Le clip sono anonime: chi le ascolta non ha la possibilità di conoscerne la provenienza, ma soltanto un numero identificativo legato al device in uso. Amazon ci tiene quindi a precisare come l’intero lavoro di formazione dell’IA sia stato curato nei minimi dettagli, con massimo rispetto per la privacy affinché la necessaria fase di ascolto finalizzata al miglioramento delle performance del servizio non sia in alcun caso un compromesso in termini di tutela della vita privata degli utenti.
Dietro l’Intelligenza di Alexa, insomma, non ci sono soltanto algoritmi: c’è anche molta mente umana, c’è lo sforzo interpretativo di una persona in carne e ossa il cui lavoro quotidiano diventa quindi prezioso elemento statistico a disposizione degli algoritmi. Quando si invoca “Alexa” per porre una domanda, ora si hanno un paio di certezze in più: primo, che quella clip audio potrebbe essere ascoltata da qualcuno, analizzata ed appuntata in un database; secondo, che la risposta a quella clip non sarà soltanto frutto di un sistema intelligente, ma anche del lavoro di oltre mille lavoratori che dedicano 9 ore al giorno per insegnare ad un algoritmo la propria lingua.