Mozilla: in download il dataset di Common Voice

Mozilla: in download il dataset di Common Voice

Mozilla mette a disposizione di tutti un enorme dataset di voci generato in crowdsourcing: include migliaia di ore di registrazioni in 18 lingue.
Mozilla: in download il dataset di Common Voice
Mozilla mette a disposizione di tutti un enorme dataset di voci generato in crowdsourcing: include migliaia di ore di registrazioni in 18 lingue.

Il progetto Common Voice messo in campo negli anni scorsi da Mozilla compie oggi uno step importante nel suo percorso evolutivo: la Fondazione annuncia la disponibilità, aperta a tutti, del più grande dataset vocale al mondo che raccoglie i contributi forniti da oltre 42.000 persone. Attraverso la formula del crowdsourcing sono state generate quasi 1.400 ore di registrazioni in 18 lingue differenti. Tra queste è presente anche l’italiano, insieme a inglese, francese, tedesco e cinese tradizionale.

Il progetto Common Voice di Mozilla

L’obiettivo di Common Voice è stato fin dal primo momento quello di supportare il lavoro di startup, ricercatori e aziende nello sviluppo di applicazioni e servizi basati sul riconoscimento vocale o più in generale sui comandi da impartire sfruttando la voce. I contributi sono stati raccolti mediante la registrazione di frasi originali di dominio pubblico (CC0). Il dataset sarà presto reso disponibile per il download nella sua forma integrale: al momento Mozilla consente di scaricarne le porzioni relative a una delle lingue incluse attraverso il sito ufficiale dell’iniziativa.

Il progetto Common Voice di Mozilla

La qualità dell’archivio è garantita dall’approccio impiegato: chiunque è stato libero di contribuire, senza filtri, andando così a comporre un insieme di voci eterogeneo in termini di età, sesso e accento. Un valore aggiunto quando si tratta di dati da impiegare per l’addestramento dei motori di riconoscimento.

Mozilla Common Voice

Common Voice riunisce tra gli altri volontari appassionati, addetti ai lavori che fanno parte del settore tecnologico, sviluppatori e linguisti. Nel tempo vengono man mano aggiunte frasi da leggere e ognuno, armato di una semplice applicazione mobile o del microfono integrato nel computer, può inviare la propria registrazione in pochi secondi. È possibile scegliere se allegare o meno all’upload alcuni metadati inerenti le informazioni già accennate: età, sesso e accento.

Modalità che fin da subito hanno stimolato interesse ed entusiasmo, tanto che il progetto è cresciuto rapidamente. Per il futuro è prevista l’introduzione al supporto di decine di nuove lingue e il continuo miglioramento sia del sito ufficiale dell’iniziativa sia delle sue applicazioni mobile, anche sulla base dei feedback raccolti.

Fonte: Mozilla
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
1 mar 2019
Link copiato negli appunti