Dopo Mozilla Foundation, che ha rilasciato il progetto Common Voice il mese scorso, anche Google ha recentemente dato un suo contributo per la creazione di intelligenze artificiali sempre più efficaci nelle operazioni di riconoscimento vocale ( speech-to-text ).
Con un articolo sul proprio blog , i team di TensorFlow e AIY hanno annunciato la pubblicazione dello Speech Commands Dataset : un dataset, appunto, contenente 65.000 registrazioni vocali di 30 semplici parole, pronunciate da volontari provenienti da tutto il mondo.
Il dataset, disponibile per il download , è stato rilasciato sotto licenza Creative Commons BY 4.0 ; le applicazioni Web ed Android utilizzate per la sua creazione, invece, sono state rilasciate sotto licenza Apache 2.0 , la quale consente, a differenza della prima, di imporre limitazioni all’utilizzo di eventuali versioni modificate.
È possibile contribuire alla crescita del dataset inviando fino a 135 registrazioni, attraverso l’applicazione Web disponibile sul sito di Google AIY .
Sono inoltre disponibili, oltre all’immagine Docker del framework TensorFlow , una serie di applicazioni di esempio che sfruttano le capacità del framework, oltre a dei tutorial per il training dei propri modelli di riconoscimento vocale.
Elia Tufarolo