in

Alter 3, le robot devenu humain grâce à GPT-4

Des chercheurs de l’université de Tokyo ont jeté un pont entre les grands modèles de langage et les robots. Ils ont cependant créé Alter 3, un robot humanoïde disposant des capacités humaines.

Alter 3, la dernière itération d’un robot humanoïde lancé en 2016, est maintenant guidée à travers diverses simulations par GPT-4. Les chercheurs utilisent cette approche pour des activités telles que prendre un selfie, lancer une balle, manger du pop-corn et jouer de la air guitar.

Changement de paradigme

Autrefois, coder chaque activité nécessitait une programmation spécifique. Mais l’adoption de GPT-4 confère aux robots de nouvelles capacités étendues. Ces systèmes ont aujourd’hui la capacité d’apprendre via le langage naturel.

Dans une récente étude, les chercheurs ont affirmé que les robots alimentés par intelligence artificielle ont principalement pour objectif de faciliter la communication de base entre les humains et les robots au sein d’un environnement informatique. Ils utilisent donc des LLM pour interpréter et simuler des réponses réalistes.

Ils ont d’ailleurs affirmé que le contrôle direct est désormais réalisable en associant les expressions linguistiques des actions humaines au corps du robot à travers un code de programme. Cette avancée a été qualifiée de « changement de paradigme ».

Alter 3, doté de 43 axes simulant les mouvements musculo-squelettiques humains, excelle dans des mouvements complexes du haut du corps, y compris des expressions faciales détaillées. Bien qu’il puisse imiter la marche, ce robot repose sur un socle et n’a pas la capacité de se déplacer de manière autonome.

De l’humour mais surtout des aptitudes inégalées, les capacités d’apprentissage d’Alter 3 sont étonnantes

Selon les chercheurs de l’Université de Tokyo, utiliser les LLM dans le monde de la robotique permet de franchir les limites que les robots ne pouvaient pas dépasser. Aujourd’hui, les robots humanoïdes sont de plus en plus agiles. Ils peuvent même prendre des photos et exécuter d’autres tâches qui leur ont été impossibles à effectuer il y a quelques mois.

Quant à Alter 3, il bénéficie d’une petite touche d’humour. Dans le cadre d’une simulation, il fait semblant de déguster un sac de pop-corn posé à côté de lui afin de comprendre qu’il appartient à la personne assise juste à côté. Pour exprimer sa surprise et sa gêne face à cette situation, Alter 3 affiche des expressions faciales exagérées et fait des gestes amplifiés avec ses bras.

Une capacité d’apprentissage sans données

Doté d’une caméra, l’Alter 3 est capable d’observer les humains. Des chercheurs ont remarqué que le modèle peut désormais améliorer ses comportements en analysant les réactions humaines. Il utilise d’ailleurs une forme d’apprentissage imitatif semblable à celui des nouveau-nés étudié par les behavioristes.

Toujours d’après les chercheurs, la fonctionnalité d’apprentissage sans données d’entraînement des robots GPT-4 connectés à Internet pourrait changer fondamentalement les interactions homme-machine. Cette approche devrait également mener à des robots plus intelligents, adaptables et personnalisables.

Ces découvertes sont présentées dans l’article intitulé « Transformer le texte en mouvement : implantation de GPT-4 dans un robot humanoïde Alter3 » rédigé par Takahide Yoshida, Atsushi Masumori et Takashi Ikegami. L’article est accessible sur le serveur de prépublications scientifiques arXiv.

Newsletter

Envie de ne louper aucun de nos articles ? Abonnez vous pour recevoir chaque semaine les meilleurs actualités avant tout le monde.

Cliquez pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *


The reCAPTCHA verification period has expired. Please reload the page.