RoboHorizon : l'IA donne aux robots des compétences pour des tâches longues

Dans une avancée qui devrait donner des sueurs froides aux designers de meubles suédois, des chercheurs ont levé le voile sur RoboHorizon, un nouveau cadre d’IA qui décuple la capacité d’un robot à accomplir des tâches complexes en plusieurs étapes. Le système utilise astucieusement un Grand Modèle Linguistique (LLM) pour endosser le rôle d’une sorte de chef de projet, décomposant des instructions vagues en une série de sous-tâches réalisables et générant une structure de récompense dense pour maintenir le robot sur la bonne voie. Ce nouveau pipeline Reconnaître-Sentir-Planifier-Agir (RSPA) a entraîné une amélioration spectaculaire de 29,23 % des taux de succès sur les tâches à long horizon.

Le problème fondamental de la robotique à long horizon réside dans le fait que les tâches n’offrent souvent que des récompenses éparses ; un robot ne peut savoir qu’il a réussi qu’après une douzaine d’étapes complexes, ce qui rend difficile d’apprendre quelles actions spécifiques étaient les bonnes. RoboHorizon s’attaque à ce défi en faisant en sorte qu’un LLM crée une liste de contrôle détaillée avec des récompenses pour chaque étape. Ceci est associé à une méthode de « découverte de points clés » qui aide le robot à concentrer son système visuel sur les moments les plus critiques d’une tâche, comme l’instant où une pince entre en contact avec un objet. C’est l’équivalent robotique de ne pas se laisser distraire et de lire réellement les instructions. Oui, même les robots ont besoin de ce rappel.

A diagram illustrating the Recognize-Sense-Plan-Act (RSPA) pipeline used by RoboHorizon.

Nulle part cela n’a été plus évident que sur le banc d’essai FurnitureBench, une série de tâches d’assemblage inspirées d’IKEA, conçues pour être uniquement frustrantes pour les systèmes autonomes. Ce test exige une planification à long terme, une manipulation précise et la capacité de connecter correctement différentes pièces – des défis qui paralysent de nombreux modèles actuels. Le succès de RoboHorizon ici démontre une avancée significative vers des robots capables de gérer le genre d’assemblage complexe et réel qui a été, jusqu’à présent, le domaine exclusif et douloureux des humains.

A table showing RoboHorizon's performance metrics across various benchmark tasks.

Pourquoi est-ce important ?

Cette recherche s’attaque à une barrière fondamentale à la création de robots polyvalents et véritablement utiles. En intégrant les capacités de planification abstraite des LLM à l’exécution physique d’un modèle du monde robotique, RoboHorizon offre un plan pour des machines capables d’accomplir des tâches complexes de manière fiable. Au lieu d’être limités à des actions uniques et répétitives, cette approche ouvre la porte à des robots qui peuvent planifier, s’adapter et exécuter des travaux en plusieurs étapes dans les usines, les laboratoires, ou même les maisons, rapprochant le rêve d’un assistant robotique compétent d’un pas de géant vers la réalité.