Dans la course effrénée pour concevoir le cerveau artificiel ultime destiné aux robots humanoïdes, un schisme philosophique fascinant est en train de voir le jour. Il ne s’agit plus seulement de faire marcher un robot ou de lui faire apporter un soda. La véritable guerre se joue désormais dans l’architecture même de l’esprit. D’un côté, on trouve le prodige — le savant « end-to-end » qui apprend par l’observation. De l’autre, la bureaucratie méticuleusement organisée. C’est dans ce second camp que s’installe avec assurance Humanoid avec son nouveau framework d’IA, KinetIQ, un système conçu non pas pour piloter un seul robot, mais pour diriger un orchestre entier de machines.
Cela pose immédiatement les bases d’un duel de haut vol avec Figure AI, dont le Figure Helix 02 : un cerveau IA pour faire la vaisselle a bluffé les observateurs par sa fluidité et son autonomie sur de longues séquences. Là où Figure mise sur la création d’un réseau neuronal unique et unifié capable d’apprendre des tâches complexes et multi-étapes, Humanoid s’attaque au problème — sans doute plus complexe et industriel — de la gestion de flotte. C’est le combat entre le virtuose et le maître d’œuvre, et l’issue pourrait bien définir la manière dont les robots s’intégreront dans notre quotidien pour les décennies à venir.
KinetIQ : l’échelle de la cognition en entreprise
Le système KinetIQ de Humanoid repose sur ce qu’ils appellent une architecture « cross-timescale » (multi-échelle temporelle), une manière élégante de décrire un mille-feuille de commande et de contrôle à quatre niveaux. C’est un framework agentique qui réfléchit comme une multinationale, où chaque strate opère à sa propre vitesse et à son propre niveau d’abstraction.
Tout en haut trône le Système 3, l’orchestrateur de flotte agentique. C’est le « C-suite », la direction générale qui s’interface avec les logiciels de gestion d’usine ou d’entrepôt pour recevoir des objectifs de haut niveau. Il opère sur une échelle de temps allant de la seconde à la minute, traitant chaque robot de sa flotte hétérogène — qu’il soit bipède ou à roues — comme une ressource à déployer pour une efficacité maximale.
Un cran en dessous, on trouve le Système 2, le chef de projet au niveau du robot. Cette couche utilise un modèle de langage omni-modal pour interpréter les directives du Système 3 et les décomposer en une séquence de sous-tâches pour une unité donnée. Il raisonne sur son environnement et peut modifier son plan de manière dynamique, résolvant les problèmes à la volée.
Pour les instructions instantanées, le Système 1 entre en scène : un réseau Vision-Language-Action (VLA) qui joue le rôle de chef d’équipe. Cadencé à une fréquence de 5 à 10 Hz, il génère un flux continu de poses cibles pour les différentes parties du corps du robot — mains, torse, bassin — afin d’exécuter le plan tracé par le Système 2.
Enfin, pour le travail de force, voici le Système 0. C’est le contrôleur du corps entier (« whole-body controller »), tournant à 50 Hz et entraîné exclusivement via environ 15 000 heures d’apprentissage par renforcement (Reinforcement Learning) en simulation. Son unique mission, quasi frénétique : traduire les poses cibles reçues d’en haut en mouvements articulaires stables et équilibrés, pour éviter que le robot ne s’étale de tout son long en essayant de ramasser un carton.

Helix 02 : le virtuose de l’« End-to-End »
Dans l’autre coin du ring, on trouve le Helix 02 de Figure AI, un système à la philosophie radicalement différente. Au lieu d’une bureaucratie multicouche, Helix 02 est bâti autour d’un réseau neuronal visuomoteur unique et unifié. Son mantra ? « All sensors in, all actuators out » (tous les capteurs en entrée, tous les actionneurs en sortie), connectant directement la vision, le toucher et la proprioception à chaque articulation dans un système continu.
Bien qu’il conserve une certaine hiérarchie, sa structure est bien plus compressée :
- Le Système 2 gère le raisonnement sémantique de haut niveau, un peu comme les échelons supérieurs de KinetIQ.
- Le Système 1 est là où la magie opère. C’est une « policy » (politique de contrôle) ultra-puissante qui traduit la perception directement en cibles articulaires pour tout le corps à une vitesse de 200 Hz.
- Le Système 0 constitue sa fondation physique, un contrôleur qui garantit la fluidité et la stabilité des mouvements. Mais contrairement à l’approche purement RL de KinetIQ, le Système 0 de Helix a été entraîné sur plus de 1 000 heures de données de mouvements humains, apprenant les nuances de l’équilibre et de la coordination humaine avant d’être affiné par RL. Il opère par ailleurs à une fréquence fulgurante de 1 kHz.
C’est cette approche qui a permis à Figure de démontrer son robot chargeant et déchargeant un lave-vaisselle en toute autonomie pendant quatre minutes — une prouesse d’autonomie longue durée qui reste une référence dans le secteur.
Un conte de deux cerveaux : le fossé philosophique
Les différences entre KinetIQ et Helix 02 ne sont pas seulement techniques ; elles représentent deux visions distinctes du futur de la robotique.
| Caractéristique | Humanoid KinetIQ | Figure AI Helix 02 |
|---|---|---|
| Objectif principal | Orchestration de flottes de robots divers | Autonomie longue durée pour un robot unique |
| Architecture | Framework agentique à 4 couches | Réseau visuomoteur unifié à 3 couches |
| Entraînement Système 0 | ~15 000 h d’apprentissage par renforcement pur | 1 000+ h de données humaines + RL |
| Vitesse Système 0 | 50 Hz | 1000 Hz (1 kHz) |
| Point fort | Scalabilité, fiabilité et gestion de plateformes variées | Fluidité, dextérité et apprentissage de tâches complexes |
| Analogie | Une entreprise de logistique parfaitement huilée | Un athlète de haut niveau en solo |
Le design agentique et stratifié de KinetIQ est pragmatique. En séparant les responsabilités, Humanoid peut théoriquement améliorer, déboguer ou même remplacer des couches individuelles sans avoir à reconstruire tout le système. Cette modularité est idéale pour les environnements industriels où la fiabilité et la coordination entre de nombreuses machines sont primordiales.
L’approche « end-to-end » de Figure est plus ambitieuse dans sa quête d’une intelligence générale. En entraînant le système sur des données humaines, l’objectif est de créer un modèle fondateur pour l’action physique, intrinsèquement plus gracieux et adaptable au chaos non structuré du monde réel. Le robot apprend comment bouger comme un humain, et pas seulement comment atteindre un objectif.
La vraie course : des démos clinquantes aux tâches ingrates
En fin de compte, la supériorité d’une architecture ne se décidera pas en laboratoire, mais dans les usines et dans nos foyers. Humanoid parie que le pactole immédiat de plusieurs milliards de dollars se trouve dans la logistique et la fabrication, où l’orchestration de flottes de robots spécialisés est le défi central. KinetIQ est taillé sur mesure pour ce monde-là.
Figure AI, avec son focus sur les tâches complexes et centrées sur l’humain, semble jouer sur le plus long terme, visant un véritable robot à usage général capable de naviguer un jour dans n’importe quel environnement humain. La dextérité époustouflante démontrée — de la manipulation de pilules au dosage précis de seringues — montre un système qui repousse les limites du contrôle moteur fin.
Le bras de fer est lancé. L’avenir de la robotique sera-t-il dirigé par un gestionnaire de flotte méticuleux ou par un prodige robotique virtuose ? KinetIQ est un argument de poids en faveur du premier : un système conçu non pas pour les réseaux sociaux, mais pour la réalité exigeante d’un déploiement industriel 24h/24 et 7j/7. Pour plus d’informations, vous pouvez consulter l’annonce originale sur [thehumanoid.ai](https://thehumanoid.ai/introducing-kinetiq/ “thehumanoid.ai” hreflang=“en”).













