Il Robotics Team di Google DeepMind ha annunciato tre nuovi modelli per l’addestramento dei robot che permettono di velocizzare l’apprendimento, l’esecuzione delle operazioni e la comprensione dell’ambiente circostante. L’azienda californiana ha inoltre sviluppato una serie di regole ispirate alle tre leggi della robotica di Isaac Asimov.
Robot più intelligenti e sicuri
I robot vengono principalmente utilizzati per eseguire un singolo compito ripetitivo. Per sviluppare veri aiutanti personali è necessario simulare il comportamento umano attraverso complessi modelli di intelligenza artificiale che garantiscono l’esecuzione rapida delle operazioni, senza causare danni a persone e cose nelle vicinanze. I nuovi modelli sviluppati da Google DeepMind sono AutoRT, SARA-RT e RT-Trajectory.
AutoRT combina LLM (Large Language Model) o VLM (Visual Language Model) con i i modelli di controllo dei robot (RT-1 o RT-2) per creare un sistema in grado di utilizzare robot per raccogliere dati di addestramento in ambienti nuovi. AutoRT permette di controllare simultaneamente più robot, dotati di videocamera, per svolgere diversi compiti.
Il sistema utilizza un VLM per comprendere l’ambiente e gli oggetti. Successivamente, un LLM suggerisce un elenco di compiti creativi che il robot potrebbe svolgere. I ricercatori hanno verificato il funzionamento del sistema con 20 robot in contemporanea. Sono stati effettuati 77.000 test ed eseguite 6.650 attività.
Al Large Language Model usato da AutoRT sono stati aggiunti alcuni prompt di sicurezza, denominati Robot Constitution, per impedire al robot di eseguire determinate attività che coinvolgono esseri umani, animali, oggetti taglienti ed elettrodomestici. Queste regole sono ispirate alla tre leggi della robotica di Isaac Asimov, in particolare alla prima (“Un robot non può ferire un essere umano“).
SARA-RT è invece un sistema che converte i modelli RT (Robotics Transformer) in versioni più efficienti. Dopo aver applicato SARA-RT al modello RT-2, i ricercatori hanno ottenuto un incremento di precisione del 10,6% e di velocità del 14% nell’esecuzione dei compiti da parte del robot.
RT-Trajectory, infine, aggiunge una traiettoria 2D ai video usati per l’addestramento. Si tratta di immagini RGB che indicano il movimento che deve essere effettuato dal braccio del robot. In pratica viene specificato come eseguire un compito (ad esempio, pulire il tavolo) in modo più efficiente.