Dans un mouvement qui devrait provoquer une onde de choc mêlée d’excitation et d’appréhension au sein de la communauté robotique, NVIDIA vient de passer en open-source SONIC, un modèle de fondation conçu pour que les robots humanoïdes fassent enfin autre chose que des acrobaties pré-programmées ultra-léchées. L’objectif, tel qu’énoncé par Yuke Zhu, chercheur chez NVIDIA, est de détourner l’industrie de sa « focalisation exclusive » sur des mouvements agiles mais figés pour enfin « mettre des humanoïdes généralistes au travail, pour de vrai ». Laissez infuser l’idée : du vrai travail.
SONIC (acronyme de Supersizing mOtion tracking for Natural humanoId Control) est un « modèle de fondation comportemental » dédié à la génération de mouvements du corps complet en temps réel. Le système a été entraîné sur un dataset colossal de plus de 100 millions d’images de capture de mouvement humain — soit plus de 700 heures de personnes courant, sautant ou rampant — afin de doter les robots d’une compréhension fondamentale du mouvement naturel. L’intérêt ? S’affranchir de la fastidieuse étape de l’ingénierie de récompense (reward engineering) spécifique à chaque tâche. Le système supporte aussi bien le contrôle à distance via téléopération que l’inférence à partir de modèles Vision-Langage-Action (VLA), permettant ainsi à une politique de contrôle unique et unifiée de piloter un robot de A à Z.
Et visiblement, on ne parle pas que de théorie. Un bêta-testeur a rapporté avoir déployé le système en seulement quelques heures, qualifiant ses performances de « supérieures ». Pour un secteur habitué à passer des mois sur le réglage minutieux des contrôleurs, un temps d’installation qui se compte en heures relève quasiment du miracle.
Pourquoi est-ce une étape cruciale ?
Pendant des années, la robotique humanoïde est restée coincée dans une boucle de démonstrations techniques : des prouesses d’agilité impressionnantes mais fragiles, qui ne se traduisent que rarement par des applications concrètes. En rendant ce contrôleur généraliste surpuissant accessible à tous, NVIDIA est en train de « commoditiser » la base même de la locomotion humanoïde. Cela abaisse considérablement la barrière à l’entrée pour les startups et les chercheurs, leur permettant de se concentrer sur le raisonnement de haut niveau et l’exécution des tâches plutôt que de réinventer la roue (ou plutôt la jambe) robotique.
C’est une offensive stratégique, étroitement liée au Projet GR00T (Generalist Robot 00 Technology) de NVIDIA, dont l’ambition est de créer une plateforme logicielle et IA standardisée pour la prochaine génération de machines. L’ère des saltos arrière pour générer des clics touche peut-être à sa fin, remplacée par une ère beaucoup plus banale, mais infiniment plus précieuse : celle des robots capables de faire réellement la vaisselle.













