Microsoft ha rilasciato il codice di Distributed Machine Learning Toolkit (DMLT), un tool che va ad arricchire ulteriormente l’ offerta open source della corporation statunitense e che intercetta il nuovo trend del machine learning e del calcolo distribuito personalizzato.
Come già fatto da Google , anche Redmond dice di voler offrire le proprie tecnologie di intelligenza artificiale alla community di ricercatori globale, includendo per di più una serie di API facili da usare che permettono di concentrarsi sui task specifici piuttosto che sull’aspetto tecnico dell’infrastruttura informatica usata per la loro esecuzione.
Al momento il pacchetto FOSS di DMLT include tre diversi elementi chiave, vale a dire il framework DMTK con un componente server che supporta un modello di dati ibrido e un SDK per client, l’algoritmo LightLDA ad alta efficienza per il training dei modelli basati su argomenti, e il tool Distributed Word Embedding ( DWE ) usato per operare con il linguaggio naturale.
LightLDA è in grado di processare modelli e dati su larga scala anche su un cluster di modeste dimensioni, sostiene Microsoft, mentre DWE include le implementazioni distribuite di due diversi algoritmi per il “word embedding” – Word2vec e un algoritmo in grado di lavorare con i termini polisemici.
Microsoft propone DMLT come uno strumento capace di applicazioni big data ad alta efficienza anche su un numero ridotto di unità computazionali, mentre per quanto riguarda le tecnologie presenti al suo interno la corporation promette l’integrazione di nuovi componenti nelle future versioni del kit.
Alfonso Maruccia