DeepMind, il laboratorio di Google per l’intelligenza artificiale, ritiene che risolvere complessi problemi di geometria possa essere la chiave per migliorare le prestazioni dei sistemi AI. Per dimostrare questa ipotesi, DeepMind ha sviluppato AlphaGeometry, un sistema in grado di risolvere un numero di problemi geometrici pari alla media delle medaglie d’oro nelle Olimpiadi Internazionali di Matematica.
AlphaGeometry riesce a risolvere 25 quesiti olimpici in tempo record, superando il precedente primato di 10. Un risultato che conferma l’ipotesi di DeepMind: fare progressi nella soluzione di impegnativi problemi geometrici può rendere l’intelligenza artificiale più performante ed efficiente.
Secondo i ricercatori di DeepMind Trieu Trinh e Thang Luong, “Risolvere problemi di geometria di livello olimpico rappresenta un’importante conquista nello sviluppo di un ragionamento matematico profondo, un passo verso sistemi di intelligenza artificiale più evoluti e generali“. Nel presentare il sistema AlphaGeometry, i ricercatori auspicano che possa “contribuire ad aprire nuove possibilità per la matematica, la scienza e l’AI“.
La geometria stimola il ragionamento logico cruciale per l’AI generale
Secondo DeepMind, risolvere problemi di geometria è importante perché richiede sia il ragionamento che la capacità di scegliere tra possibili opzioni, abilità necessarie per i sistemi di AI generale. Dimostrare teoremi matematici implica la padronanza del ragionamento logico e la capacità di scoprire nuove conoscenze, obiettivi irraggiungibili per le AI odierne.
Addestrare un sistema di intelligenza artificiale a risolvere problemi di geometria pone sfide uniche. A causa della complessità nel tradurre le dimostrazioni in un formato comprensibile per le macchine, c’è una scarsità di dati adatti per l’addestramento sulla geometria. Inoltre, molti degli attuali modelli di AI generativa, pur essendo eccezionali nell’identificare schemi nei dati, non hanno la capacità di ragionare logicamente attraverso i teoremi.
La soluzione di DeepMind è stata duplice: ha abbinato un modello di “linguaggio neurale” – architettonicamente simile a ChatGPT – con un “motore di deduzione simbolica“, in grado di sfruttare regole matematiche per dedurre le soluzioni. I motori simbolici possono essere poco flessibili e lenti con grandi insiemi di dati. DeepMind ha risolto questo facendo sì che il modello neurale “guidasse” il motore di deduzione attraverso le possibili risposte ai problemi geometrici.
DeepMind crea dati sintetici per addestrare AlphaGeometry
Invece di dati reali, DeepMind ha generato 100 milioni di “teoremi sintetici” con relative prove di complessità variabile, per poi addestrare da zero AlphaGeometry su questi dati. Il sistema è stato poi testato su problemi di geometria delle Olimpiadi, che richiedono di aggiungere costrutti come punti e linee ai diagrammi. Il modello neurale di AlphaGeometry prevede quali costrutti potrebbero essere utili, e il motore simbolico utilizza queste intuizioni per fare deduzioni e trovare soluzioni.
Reti neurali e motore simbolico: la combinazione vincente
Secondo i ricercatori, la combinazione di idee rapide e intuitive del modello neurale con il ragionamento più razionale del motore simbolico è la chiave del successo. I risultati pubblicati su Nature alimenteranno il dibattito su reti neurali vs sistemi simbolici per costruire AI.
I sostenitori dell’approccio delle reti neurali ritengono che comportamenti intelligenti – dal riconoscimento vocale alla generazione di immagini – possano emergere semplicemente da grandi quantità di dati e calcoli. Diversamente dai sistemi simbolici, che risolvono problemi definendo regole dedicate, le reti neurali cercano di risolverli attraverso approssimazioni statistiche e apprendimento da esempi.
Le reti neurali sono alla base di potenti sistemi AI come DALL-E 3 e GPT-4 di OpenAI. Tuttavia, i sostenitori dell’AI simbolica sostengono che non sono la risposta definitiva. L’AI simbolica potrebbe essere più adatta a codificare la conoscenza del mondo, ragionare su scenari complessi e “spiegare” il ragionamento dietro una risposta.
Come sistema ibrido neurale-simbolico, AlphaGeometry dimostra forse che la combinazione dei due approcci – manipolazione di simboli e reti neurali – è la via migliore verso un’intelligenza artificiale generalizzabile. In ogni caso, sarà la ricerca a stabilirlo.