Dactyl, il robot che sa risolvere il cubo di Rubik

Il cubo di Rubik è un famoso rompicapo in tre dimensioni inventato negli anni Settanta. Un gioco a cui molti adolescenti (ma anche adulti) di quell’epoca si sono dedicati, complesso e appassionante dal punto di vista logico-matematico e manuale. È per questo motivo che risolvere questo tipo di puzzle è una sfida rilevante per un robot, per testarne le abilità. Ora, finalmente, Dactyl ci è riuscito. Di cosa si tratta? Che significato ha questo traguardo? Capiamolo insieme.

Il cubo di Rubik è un famoso rompicapo in tre dimensioni inventato negli anni Settanta. Un gioco a cui molti adolescenti (ma anche adulti) di quell’epoca si sono dedicati, complesso e appassionante dal punto di vista logico-matematico e manuale. È per questo motivo che risolvere questo tipo di puzzle è una sfida rilevante per un robot, per testarne le abilità. Ora, finalmente, Dactyl ci è riuscito. Di cosa si tratta? Che significato ha questo traguardo? Capiamolo insieme.

Movimento e destrezza nei robot: abilità difficili da insegnare

Come spiegano gli scienziati di OpenAI, laboratorio di ricerca sull’intelligenza artificiale, le nostre mani ci permettono di assolvere molti compiti anche complessi, che nei passati decenni potevano essere svolti da robot specializzati unicamente in un’unica singola mansione. Come alternativa, si è cercato per anni di usare robot multiuso ma con successi minimi. I ricercatori di OpenAI hanno però cambiato approccio: hanno usato un hardware “vecchio”, una mano robotica impiegata negli ultimi 15 anni, con un’altra tipologia di software. Dal 2017 hanno tentato di allenare la mano robotica simile a quella umana nel risolvere il cubo di Rubik. Perché proprio questo obiettivo? È un problema rilevante non solo per il rompicapo in sé ma anche per il livello di destrezza manuale che richiede, soprattutto se si adopera una sola mano.

Il cubo di Rubik risolto con una sola mano robotica

Dactyl – questo è il nome della mano robotica – ha risolto il cubo di Rubik in una simulazione nel 2017. Nel mondo fisico e non in quello virtuale, nel 2018, l’arto riusciva a manipolare solo un singolo cubo. Ora finalmente l’obiettivo è stato raggiunto. Risolvere il cubo di Rubik con una mano è difficile anche per un essere umano e un bambino ha bisogno di molti anni e allenamento per raggiungere quella destrezza. Lo stesso Dactyl non è ancora perfetto, con il suo 40% di insuccessi.
La mano robotica come ha imparato a venire a capo del celebre puzzle? Con un algoritmo di apprendimento per rinforzo inizialmente allenato in una simulazione e, in seguito, nel mondo fisico. L’apprendimento per rinforzo è una tecnica di apprendimento, applicata al machine learning, che ha come finalità l’attuazione di sistemi in grado di apprendere e adattarsi alle mutazioni dell’ambiente in cui sono immersi, attraverso la distribuzione di una “ricompensa” – il rinforzo – che consiste nella valutazione delle loro prestazioni.
Perché iniziare in un ambiente simulato? Effettuare continui test sull’hardware potrebbe danneggiare il robot mentre con la simulazione si è in una zona protetta in cui l’algoritmo può sbagliare un grande numero di volte, mediante tentativi ed errori, senza far subire danni alla macchina. L’unico ostacolo è che il virtuale, per quanto ben progettato, ha sempre degli aspetti diversi rispetto al mondo fisico e ciò rende molto difficile applicare un algoritmo allenato virtualmente alla realtà. Dactyl, però, ha superato questa prova.

{youtube}https://www.youtube.com/watch?v=kVmp0uGtShk&feature=youtu.be{/youtube}

A cosa serve essere riusciti a insegnare a un robot a risolvere il cubo di Rubik?

Gli scienziati di OpenAI, come riportato nell’articolo pubblicato su MIT Technology Review, credono che questi ultimi risultati forniscano le prove che la nuova strategia sbloccherà i robot multiuso, che potranno così adattarsi ad ambienti aperti come, ad esempio, le cucine di casa. Se Dactyl è riuscito a manipolare un cubo di Rubik, potrà farlo con oggetti meno complessi. C’è chi, però, rimane scettico: sono Leslie Kaelbling, professore del MIT, e Dmitry Berenson, esperto di manipolazione nelle macchine alla University of Michigan. In particolare, secondo Berenson, è proprio l’apprendimento per rinforzo parte del problema poiché la tecnica è progettata per padroneggiare solo un compito specifico con qualche possibilità di flessibilità per le variazioni legate alla manipolazione. Nel mondo reale, spiega Berenson, il numero di potenziali variazioni va oltre ciò che può essere ragionevolmente simulato. In una mansione di pulizia, per esempio, ci possono essere differenti tipi di scope, di sporco e, naturalmente, di pavimenti. Inoltre l’apprendimento per rinforzo è pensato per imparare nuove abilità partendo da zero, presupposto non efficiente nella robotica così come negli esseri umani. Per capire meglio cosa s’intende, pensate se vi dovessero insegnare a pulire un piano cottura con una spugna partendo dal controllo dei movimenti delle vostre mani, come quando eravate molto piccoli e non sapevate ancora maneggiare un qualunque oggetto.
Bisognerà aspettare ancora molto per l’assistente di cucina robotico perfetto.

Ci sono macchine che possono offrirci un’altra tipologia di aiuto. Ve lo spiegherà Paolo Gallina nell’articolo “Le macchine anti-edonistiche”, pubblicato nel numero di dicembre 2017 di Sapere.

Credits immagine: foto di rubylia da Pixabay