Figure Helix 02 : un cerveau IA pour faire la vaisselle

Pendant des années, les robots humanoïdes ont été les adolescents maladroits du monde de la tech : brillants pour exécuter des chorégraphies millimétrées ou des saltos arrière, mais désespérément gauches dès qu’il s’agissait de vider une poubelle. L’industrie de la robotique s’est longtemps cassé les dents sur la « loco-manipulation », ce défi technique diabolique consistant à faire marcher un robot tout en utilisant ses mains, sans qu’il ne s’effondre dans un fracas de pièces détachées à prix d’or.

C’est ici qu’entre en scène Figure AI avec Helix 02, un nouveau modèle d’IA qui ne se contente pas de faire deux choses à la fois. Il marche, porte de la vaisselle fragile et vide un lave-vaisselle dans une séquence autonome continue de quatre minutes. On ne parle pas ici d’une énième démo léchée sur un coin de table, mais de la preuve qu’un réseau de neurones unique peut contrôler l’intégralité du corps d’un humanoïde, des pixels jusqu’au couple des moteurs, comblant enfin le fossé entre la locomotion et la manipulation.

La fin des robots « Frankenstein »

Traditionnellement, pour qu’un humanoïde accomplisse la moindre tâche utile, il fallait assembler un monstre de Frankenstein logiciel. Un contrôleur gérait la marche, passait le relais à un autre pour la stabilisation, qui lui-même déléguait à un troisième pour la saisie des objets. Le résultat ? Un processus lent, fragile et profondément artificiel. Si un objet bougeait de quelques centimètres, tout l’édifice logique s’écroulait.

« La véritable autonomie exige une approche radicalement différente : un système d’apprentissage unique capable de raisonner sur l’ensemble du corps simultanément », explique l’annonce de Figure. « Un système qui perçoit, décide et agit en continu. »

C’est précisément le problème que Helix 02 a été conçu pour résoudre. Au lieu de bricoler des systèmes disparates, Figure a créé une architecture d’IA hiérarchique qui pense et agit comme un tout unifié.

Trois cerveaux pour un seul corps

Le secret de Helix 02 réside dans une architecture à trois niveaux, chacun opérant sur sa propre échelle de temps. Imaginez une hiérarchie d’entreprise : du PDG qui fixe la stratégie au stagiaire qui exécute les tâches sur le terrain.

  • Système 2 (Le Stratège) : C’est la couche de raisonnement de haut niveau. Il analyse les scènes et le langage, décomposant une commande comme « Vide le lave-vaisselle » en une série d’objectifs. Il travaille lentement, avec une vision globale.
  • Système 1 (Le Tacticien) : C’est la politique visuomotrice qui relie tous les sens du robot — caméras de tête, nouvelles caméras de paume et capteurs tactiles au bout des doigts — à toutes ses articulations. Il traduit les objectifs du S2 en commandes corporelles rapides à 200 Hz.
  • Système 0 (L’Athlète) : C’est la fondation, un modèle entraîné sur plus de 1 000 heures de données de mouvements humains. Opérant à une fréquence fulgurante de 1 kHz, il garantit que chaque mouvement est stable, équilibré et naturel. Dans un geste d’une audace folle, Figure précise que le Système 0 remplace 109 504 lignes de code C++ écrites à la main par un seul réseau de neurones. En clair, ils ont mis à la porte une bibliothèque entière de code pour embaucher une IA qui a appris la vie en observant des humains en boucle.
Video thumbnail

Ce pipeline « des pixels au corps entier » permet au robot d’enchaîner 61 actions de loco-manipulation distinctes lors de son ballet de quatre minutes devant le lave-vaisselle, passant avec fluidité de la marche au transport d’objets, et allant même jusqu’à utiliser sa hanche pour fermer un tiroir quand il a les mains prises.

Concrètement, qu’est-ce qu’il sait faire ?

Si la corvée de vaisselle est la star du show, l’arrivée de nouveaux composants matériels sur le robot Figure 03, notamment des caméras dans les paumes et des capteurs tactiles, ouvre une nouvelle ère de dextérité. Ces capteurs offrent à Helix 02 le retour d’information nécessaire pour des tâches autrefois impossibles pour des systèmes basés uniquement sur la vision.

Les capteurs tactiles peuvent détecter des forces de seulement trois grammes, une sensibilité suffisante pour « sentir » un trombone. Cela débloque toute une gamme de compétences motrices fines.

Une dextérité qui dépasse la cuisine

Helix 02 a été soumis à une batterie de tests pour prouver sa finesse :

  • Dévisser un bouchon de bouteille : Cela demande une coordination bimanuelle précise et un contrôle de la force pour ne pas écraser la bouteille.
  • Saisir une seule pilule dans un pilulier : Utilise les caméras de paume pour une vue rapprochée lorsque les caméras principales de la tête sont masquées.
  • Doser exactement 5 ml avec une seringue : Une tâche exigeant un retour tactile pour appliquer une force fluide et continue.
  • Trier des pièces métalliques dans un bac en désordre : Une tâche concrète issue de l’usine BotQ de Figure, prouvant sa capacité à travailler dans des environnements réels et imprévisibles.

Analyse : Un tournant pour les humanoïdes utiles

Alors que d’autres entreprises multiplient les démonstrations de prouesses athlétiques, Figure se concentre sur le défi, moins glamour mais crucial, de rendre les humanoïdes utiles dans le monde réel. Passer du premier Helix, qui ne contrôlait que le haut du corps, à l’autonomie totale de Helix 02 en seulement un an témoigne de l’accélération fulgurante du secteur.

Le point clé ici est l’abandon des comportements rigides codés à la main au profit d’un système capable d’apprendre et de s’adapter. En entraînant son modèle de base sur un jeu de données massif de mouvements humains, Figure insuffle au robot une intuition naturelle sur la façon dont un bipède doit bouger et tenir en équilibre. Cela permet à l’IA de haut niveau de se concentrer sur quoi faire, tandis que le système de bas niveau gère le comment.

L’enjeu n’est plus de construire un robot capable de faire une seule chose parfaitement, mais de créer une plateforme capable d’apprendre à faire n’importe quoi. Comme l’a souligné Brett Adcock, PDG de Figure, chaque amélioration du réseau neuronal Helix peut être déployée sur l’ensemble de la flotte, permettant à tous les robots de bénéficier de l’expérience d’un seul. Avec des actionneurs qui ne tournent actuellement qu’à 20-25 % de leur vitesse de pointe, la marge de progression sur le matériel existant est immense.

Ces résultats ne sont que les prémices, mais ils marquent un changement de paradigme. En résolvant le problème de l’autonomie continue du corps entier, Figure vient de franchir une étape décisive vers le robot universel — celui qui, enfin, sera prêt à faire les corvées sans qu’on ait besoin de lui dicter chaque ligne de code.