Google DeepMind ha presentato un sistema di AI che ha ottenuto la medaglia d’argento alle Olimpiadi Internazionali di Matematica (IMO) di quest’anno.
Il sistema ibrido di DeepMind, che unisce i modelli AlphaProof e AlphaGeometry 2, è riuscito a risolvere quattro dei sei complessi problemi proposti, conquistando così un risultato storico per l’intelligenza artificiale in matematica, che ha letteralmente sbaragliato la concorrenza umana!
L’IMO, considerato il concorso di matematica più impegnativo al mondo per gli studenti delle scuole superiori, è diventato un punto di riferimento per valutare le capacità dell’intelligenza artificiale nella risoluzione dei problemi. Il sistema di Google DeepMind ha guadagnato 28 punti su 42 possibili, appena meno della soglia della medaglia d’oro di 29 punti raggiunta quest’anno solo da 58 dei 609 concorrenti umani. (Per vedere tutte le soluzioni qui).
AlphaProof e AlphaGeometry 2, una combinazione vincente
Al centro di questo risultato c’è AlphaProof, un modello AI innovativo, che abbina un modello linguistico pre-addestrato con l’algoritmo di apprendimento per rinforzo AlphaZero, la stessa tecnologia che ha stravinto contro algoritmi concorrenti in giochi complessi come gli scacchi e il Go. Questa integrazione permette ad AlphaProof di affrontare il ragionamento matematico con strategie simili a quelle di un gioco, cercando tra le possibili fasi di dimostrazione come se stesse navigando in un vasto albero decisionale.
A differenza degli approcci precedenti, limitati dalla scarsità di dati scritti dall’uomo, AlphaProof colma il divario tra linguaggio naturale e formale. Utilizza una versione ottimizzata del modello Gemini di Google per tradurre i problemi in linguaggio naturale in affermazioni formali, creando una vasta libreria di materiale di addestramento.
A completamento di AlphaProof c’è AlphaGeometry 2, una versione aggiornata del risolutore geometrico di DeepMind. Questo sistema ha dimostrato una notevole efficienza, risolvendo un problema IMO in soli 19 secondi. Le sue migliori prestazioni derivano da dati di addestramento migliorati e da un nuovo meccanismo di condivisione delle conoscenze che consente di risolvere problemi più complessi.
Prima della competizione di quest’anno, AlphaGeometry 2 era in grado di risolvere l’83% di tutti i problemi storici di geometria IMO degli ultimi 25 anni, un avanzamento significativo rispetto alla percentuale di successo del 53% del suo predecessore.
La matematica non ha segreti per l’AI
I problemi matematici delle Olimpiadi Internazionali di Matematica sono stati tradotti manualmente in un linguaggio formale comprensibile dai sistemi di intelligenza artificiale di DeepMind. Mentre gli studenti umani hanno a disposizione due sessioni da 4 ore e mezza ciascuna per risolvere i problemi, l’AI di DeepMind è riuscita a trovare la soluzione di un problema in pochi minuti, impiegando fino a 3 giorni per gli altri quesiti più complessi.
Questo straordinario risultato mette in luce i rapidi progressi compiuti dall’AI nell’affrontare compiti avanzati di ragionamento logico-matematico. Tali sistemi hanno il potenziale, evolvendosi ulteriormente, di accelerare le scoperte scientifiche e spingersi oltre i limiti delle capacità umane. DeepMind continuerà a esplorare nuovi approcci di intelligenza artificiale per far progredire il ragionamento matematico.