Dactyl : la main robotisée qui n’a plus besoin des humains pour apprendre…

 

Des comportements humains !

Oui, vous avez bien lu. OpenAI, une association à but non-lucratif pour le développement d’une Intelligence Artificielle (IA), a mis au point un système intelligent de main robotisée.

Baptisé Dactyl, il est non seulement capable de tenir et manipuler des objets comme un humain le ferait, mais également de développer ses propres comportements.

 

Développer une IA « profitable à l’humanité »

 

 

Fondée en 2015 par Elon Musk (Tesla, SpaceX), avec plus d’un milliard de dollars d’investissement, le collectif OpenAI s’est fixé comme objectif de « faire avancer l’intelligence numérique de la manière qui serait la plus profitable à l’humanité, sans que ces recherches soient dictées par le besoin d’un retour sur investissement ».

Un objectif qui est loin d’être anodin quand on connaît les positions de l’entrepreneur à succès sur les IA. À l’instar de Bill Gates et du regretté Stephen Hawking, Elon Musk martèle dès qu’il le peut la nécessité d’entamer rapidement un processus de régulation autour des avancées rapides effectuées par des géants de la tech comme Facebook ou encore Alphabet (Société mère de Google).

OpenAI travaille donc depuis 2015 au développement des intelligences artificielles, de manière responsable ET en partageant absolument toutes ses recherches avec le reste du monde.

 

 

Alors comment faire évoluer au mieux l’IA, couplée à la robotique ?

 

Le collectif est parti d’un fait tout simple : saisir quelque chose avec sa main est l’une des premières choses que nous apprenons à faire lorsque nous sommes bébés.

Pourtant, même si notre apprentissage de ce simple geste est quasi inné pour nous, il n’en demeure pas moins complexe.
D’autant plus qu’au fur et à mesure de notre existence, nous continuons d’apprendre et de perfectionner ce geste, ajoutant ainsi une quantité phénoménale de variables et de mouvements dont nous n’avons même pas conscience.

C’est cette complexité qui rend l’apprentissage de mouvements simples difficile pour les machines.

Beaucoup de robots et de mains robotisées sont bien sûr d’ores et déjà capable de maîtriser à la perfection certains mouvements. Mais pour cela l’ensemble de ces mouvements sont fixés et écrits sous forme de code dans le logiciel grâce auquel le robot fonctionne. Une nouvelle fonction ou un nouveau mouvement entrainerait donc obligatoirement la création d’un nouveau programme ou une modification du programme existant.

Pour faire simple, pour nous autres humains, le fait de ramasser une pomme revient quasiment à la même chose que le fait de ramasser une tasse. Il y a bien sur des différences d’appréhension, mais notre cerveau les comble automatiquement, sans que nous ne nous en rendions compte, ce qui nous permet d’improviser en temps réel (agripper une nouvelle prise, tenir solidement un objet inconnu, etc…)

 

Pour faire encore plus simple :

Humains 1 – 0 Robots

 

En partant de ce constat, Josh Tobin, chercheur au sein du collectif OpenAI explique donc que « les bébés naissent avec la capacité d’imiter ce que fait autrui [comme tirer la langue]. L’imitation permet aux humains d’apprendre rapidement de nouveaux comportements, nous aimerions que nos robots apprennent aussi de cette manière ».

C’est donc avec un algorithme à l’approche bien particulière que les équipes d’OpenAI ont mené leurs expérimentations, puisqu’ils ont cherché à apprendre au robot la dextérité !

 

 

La solution d’Open IA : ne pas injecter de données humaines et randomiser les domaines

 

 

Pour parvenir à reproduire ce « schéma humain », les chercheurs d’OpenAI, plutôt que d’envoyer une grosse quantité de données dans le système, ont cherché à apprendre à Dactyl à voir et à contrôler, tout en opérant une randomisation des deux réseaux de neurones du système :

La vision : tout d’abord, Dactyl utilise ses trois caméras pour analyser son environnement et la position exacte des objets.

Le contrôle : en ayant analysé l’espace grâce à ses caméras, Dactyl peut alors définir son objectif et toutes les étapes/mouvement qu’il doit faire pour y parvenir.

Plutôt que de tester dans le monde réel (ce qui obligerait les chercheurs à sans cesse repositionner l’objet), le système simule directement en réalité virtuelle toutes les possibilités afin de trouver la bonne (principe de randomisation).
En d’autres termes, il essaie et échoue encore et encore pour trouver comment bouger exactement ses doigts afin de réaliser le mouvement

 

 

La randomisation des systèmes permet donc à Dactyl d’apprendre en simulation, conçue pour fournir une variété d’expériences plutôt que de maximiser le réalisme.

Selon les chercheurs, cela donne le meilleur des deux approches : en apprenant en simulation, Dactyl peut rassembler plus d’expériences, en un temps record. En augmentant et en minimisant le réalisme, les chercheurs peuvent aborder des problèmes que les simulateurs peuvent seulement modéliser approximativement.

Les quelques 6144 processeurs et 8 GPUs greffés au système « accumulent une centaine d’années d’expérience en 50 heures ».

 

En mettant le système au travail pour la première fois dans le monde réel, Dactyl a ainsi été capable de recréer des comportements humains.

Par exemple, les mouvements que nous faisons pour vérifier l’état d’une pomme en la faisant tourner dans notre poing sont très complexes. Dactyl a réussi à les reproduire.

 

Le plus fou, c’est qu’en plus du caractère « naturel » des mouvements obtenus, et ce de manière indépendante par le système, Dactyl peut saisir et manipuler à peu près tout ce que vous lui mettez dans sa main robotique de pointe.

Ce principe de flexibilité, appelée « généralisation », est primordial pour qu’un robot puisse interagir avec le monde réel, puisqu’il est impossible de coder à la main des comportements distincts pour chaque objet et chaque situation.

Il ne fait aucun doute que les chercheurs d’OpenAI, entourés de sommités et également épaulés par Microsoft, n’ont pas fini de faire parler d’eux.

 

 

 

Rejoignez-nous 

Vos études touchent à leurs fins ou vous êtes à la recherche de nouveaux défis ? Alors rejoignez Adentis dès aujourd’hui en cliquant sur le lien ci-dessous :

>> Je veux rejoindre Adentis <<