Juste au moment où vous pensiez que votre aspirateur robot commençait à avoir de la jugeote, la startup Genesis AI vient de dévoiler un système qui le fait passer pour un vulgaire caillou de compagnie. L’entreprise a lâché une série de vidéos mettant en scène GENE-26.5, ce qu’elle appelle un « cerveau robotique », capable d’enchaîner des tâches d’une complexité bluffante — de la préparation d’un repas au piano, en passant par des expériences en laboratoire — le tout, semble-t-il, en utilisant exactement le même modèle d’IA, sans aucun réentraînement.
D’après les publications du PDG Zhou Xian, ces démonstrations sont totalement autonomes et filmées en vitesse réelle (1x). Dans l’une des séquences, on voit le système préparer méticuleusement un plat, une prouesse que Xian commente en précisant qu’ils « cuisinent ça depuis un an » — un jeu de mots habile pour souligner que le projet mijote depuis longtemps, tout en rappelant la difficulté colossale du problème. Sans doute un peu des deux. La dextérité du système est également mise à l’épreuve sur un Rubik’s cube et dans la manipulation délicate de matériel de laboratoire avec une précision millimétrique.
Genesis AI affirme que la clé de cette percée réside dans une remise à plat totale de la « stack » robotique. Le système repose sur quatre piliers fondamentaux : un foundation model natif pour la robotique, entraîné sur le langage, la vision, la proprioception et les données tactiles ; une main robotique anthropomorphe (ratio 1:1) pour la manipulation ; un gant de collecte de données non invasif qui capture les mouvements, la force et le toucher d’un démonstrateur humain ; et enfin, un simulateur conçu pour réduire drastiquement le temps des expériences.
Pourquoi est-ce une étape cruciale ?
Le Graal de la robotique moderne, c’est la généralisation : créer un système unique capable d’apprendre et d’exécuter une grande variété de tâches sans être explicitement programmé pour chacune d’elles. Depuis des années, le principal goulot d’étranglement est la collecte de données multimodales de haute qualité auprès des humains. L’approche « full-stack » de Genesis AI, et particulièrement ce gant de capture couplé à une main quasi humaine, s’attaque frontalement au problème. Pendant que d’autres géants se concentrent sur des modèles d’IA massifs, Genesis construit tout l’écosystème nécessaire pour nourrir son modèle avec les bonnes données. Si GENE-26.5 parvient réellement à généraliser des tâches aussi diverses et délicates avec un seul jeu de paramètres, nous venons de franchir un pas de géant vers des robots qui ne se contentent plus de suivre des instructions, mais qui apprennent véritablement des savoir-faire.

