Abbiamo già visto lo scorso anno l’intelligenza artificiale sviluppata da DeepMind, AlphaGo, battere il campione mondiale di Go nella sua stessa specialità. Segno di quanto l’IA e i metodi impiegati per istruirla siano progrediti. Oggi il team, controllato dalla parent company Alphabet, annuncia il raggiungimento di un ulteriore risultato con la sua nuova creatura AlphaZero.
AlphaZero batte tutti
È un algoritmo studiato per evolvere le proprie capacità mediante tecniche di apprendimento automatico, impiegando il metodo MCTS per migliorare nel tempo le proprie abilità e pianificare le mosse da compiere. Il banco di prova scelto per testarne l’efficacia è ancora una volta quello del tavolo da gioco: i suoi autori l’hanno fatto competere con le intelligenze artificiali destinate in modo specifico agli scacchi, al shogi (una variante giapponese) e alla disciplina Go. In tutti i casi è uscito a testa alta dal confronto, battendo nella maggior parte dei match i programmi Stockfish, Elmo e il già citato AlphaGo. Nei grafici di seguito, in verde sono riportate le vittorie di AlphaZero, in grigio le partite terminate con un pareggio e in rosa le sconfitte.
Per tutti i giochi ad AlphaZero sono state fornite solo ed esclusivamente le conoscenze relative alle regole di base, dopodiché l’IA ha giocato milioni di partite contro se stessa, in solitaria, passando così per una fase di training che l’ha portata ad evolvere la propria strategia a tal punto da arrivare a dominare gli avversari. Nei primi match le mosse sono state del tutto casuali, poi raccogliendo man mano feedback sul loro effetto sono diventate sempre più mirate, secondo la più classica dinamica di reinforcement learning (o apprendimento per rinforzo).
5.000 TPU per l’IA di DeepMind
La fase di allenamento è stata piuttosto rapida: sono servite solo 9 ore per gli scacchi, 12 per il shogi e 13 giorni per Go. A gestire i calcoli un’infrastruttura composta da 5.000 TPU (Tensor Processing Unit) di prima generazione. Per intenderci, quelle presentate nel 2016 sul palco dell’evento I/O, ognuna delle quali in grado di elaborare ogni giorno oltre 100 milioni di immagini caricate dagli utenti sui server della piattaforma Google Photo.
Particolarmente interessante quanto emerso con gli scacchi, dove AlphaZero ha sviluppato da sé uno stile particolare, aggressivo e dinamico. Sul blog di DeepMind, nel suo intervento, Garry Kasparov (campione del mondo dal 1985 al 2000) sottolinea come il modo di pensare e di agire dell’IA possa costituire una fonte d’ispirazione per considerare nuovi approcci e nuove strategie.
Le implicazioni vanno ben oltre la mia amata scacchiera… Non solo queste macchine autodidatte raggiungono ottime performance, ma noi stessi possiamo apprendere dalla nuova conoscenza che producono.
Lo stesso Kasparov è stato tra il 1996 e il 1997 protagonista di una doppia sfida con il software Deep Blue sviluppato da IBM e dedicato proprio agli scacchi, uscendo a testa alta dal primo confronto e sconfitto dal secondo.
Oltre il gioco
Sebbene parlare delle performance di AlphaZero sia certamente utile per attirare l’attenzione sugli sviluppi dell’IA, osservando queste iniziative in un’ottica lungimirante non si può che etichettarle come un esercizio di stile, una prova di forza. La reale finalità di DeepMind e delle altre realtà impegnate in questo territorio va oltre, puntando alla creazione di algoritmi e sistemi in grado di trovare o quantomeno aiutare nella ricerca di una soluzione per problemi ben più urgenti, a partire da quelli inerenti l’ambito medico. Una dichiarazione d’intenti esplicitata anche sul sito ufficiale della compagnia britannica.
… pensiamo possa costituire uno dei più importanti progressi scientifici mai ottenuti, con benefici su larga scala, arrivando a incrementare la nostra capacità di comprendere i misteri dell’universo e di affrontare alcune delle più pressanti sfide del mondo reale: dai cambiamenti climatici al bisogno di nuove cure per la salute.