In una mossa destinata a scatenare un misto di euforia e panico nell’industria della robotica, NVIDIA ha rilasciato in open-source SONIC, un foundation model progettato per far sì che i robot umanoidi smettano finalmente di limitarsi a spettacolari acrobazie pre-programmate. L’obiettivo, come dichiarato dal ricercatore di NVIDIA Yuke Zhu, è quello di spostare il “focus esclusivo” del settore dai movimenti agili ma preimpostati al “mettere gli umanoidi generalisti a compiere del lavoro vero”. Fatevene una ragione: lavoro vero.
SONIC, acronimo di Supersizing mOtion tracking for Natural humanoId Control, è un “Behavior Foundation Model” per la generazione in tempo reale del movimento di tutto il corpo. È stato addestrato su un dataset mastodontico di oltre 100 milioni di frame di dati motion capture umani — parliamo di più di 700 ore di persone che corrono, saltano e strisciano — per fornire ai robot una comprensione fondamentale del movimento naturale, senza la necessità di tediose programmazioni specifiche per ogni singolo compito. Il sistema supporta sia il controllo remoto diretto tramite teleoperazione, sia l’inferenza da modelli Vision-Language-Action (VLA), permettendo a una singola policy unificata di governare l’intero robot.
E non si tratta solo di teoria. Un beta-tester ha riferito di aver implementato il sistema in poche ore, definendo le sue prestazioni “superiori”. Per un settore abituato a mesi di estenuante calibrazione dei controller, un tempo di configurazione misurato in ore ha dell’incredibile.
Perché è così importante?
Per anni, la robotica umanoide è rimasta intrappolata in un loop di demo: prestazioni atletiche impressionanti ma fragili, che raramente si traducevano in applicazioni pratiche. Rendendo open-source un controller generalista così potente, NVIDIA sta di fatto trasformando in una “commodity” la base del movimento umanoide. Questo abbassa drasticamente la barriera d’ingresso per startup e ricercatori, permettendo loro di concentrarsi sul ragionamento di alto livello e sull’esecuzione dei compiti invece di dover reinventare ogni volta la ruota (o la gamba) robotica. È una spinta strategica, chiaramente legata al più ampio Project GR00T (Generalist Robot 00 Technology) di NVIDIA, volta a creare una piattaforma software e AI standardizzata per la prossima generazione di macchine. L’era dei backflip a caccia di like potrebbe finalmente volgere al termine, sostituita da quella, decisamente più noiosa ma infinitamente più preziosa, dei robot che sanno davvero lavare i piatti.













