Durante la conferenza Hot Chips 2017 Microsoft ha svelato la sua nuova piattaforma di deep learning denominata Project Brainwave .
Composta da due livelli di tipo hardware ed uno di tipo software, è in grado di processare diverse tipologie di fonti: flussi audio e video, query di ricerca, dati ricevuti da sensori, interazioni con gli utenti.
Il primo livello consiste in un’architettura di sistema ad alte prestazioni: la rete neurale è collegata direttamente ai datacenter Microsoft in modo da offrire la potenza computazionale di una deep neural network come un microservizio sul cloud Azure, con tempi di latenza inferiori al millisecondo poiché le CPU non devono gestire alcun carico e il collo di bottiglia è rappresentato quindi solo dalla rete Internet (o ExpressRoute , per i clienti in grado di sfruttarne le potenzialità).
Il secondo livello non è altro che la rete neurale stessa, composta da chip FPGA Stratix 10 di marca Intel .
In questo caso, l’approccio utilizzato da Microsoft diverge da quello degli altri provider, come ad esempio Google, la cui rete neurale è composta da DPU più potenti e specializzate, ma fortemente dipendenti dalla tipologia del dato in input. L’azienda di Redmond, invece, sfrutta a suo vantaggio la scalabilità del cloud: i chip FPGA, seppur meno performanti, sono adattativi per una serie di dati in input definibili in fase di disegno; ulteriori miglioramenti sono garantiti dalla possibilità di introdurre aggiornamenti alla piattaforma entro finestre temporali di poche settimane.
Infine, dal punto di vista software, Brainwave supporta più framework di deep learning : al momento sono supportati Tensorflow di Google ed il proprietario Microsoft Cognitive Toolkit , ma Microsoft afferma di voler ampliare il supporto ad altri framework. I modelli generati da questi framework vengono pre-processati e convertiti, per poi essere compilati dalla piattaforma.
Per quanto riguarda il processamento dei dati, i modelli neurali principalmente utilizzati sono LSTM e GRU : volendo offrire servizi di IA in tempo reale, ogni forma di batch processing viene evitata.
Elia Tufarolo