NVIDIA otwiera SONIC: Humanoidy wreszcie wyjdą z trybu demo

W branży robotyki zawrzało – i to w sposób, który u jednych wywoła ekscytację, a u innych lekki niepokój. NVIDIA właśnie udostępniła w modelu open-source SONIC, bazowy model (foundation model), który ma sprawić, że humanoidalne roboty w końcu przestaną być tylko drogimi zabawkami do robienia efektownych, zaprogramowanych na sztywno fikołków. Jak twierdzi badacz Nvidii, Yuke Zhu, celem jest odejście od „wyłącznego skupienia” na zwinnych, ale wyreżyserowanych ruchach, na rzecz „skłonienia generalistycznych humanoidów do prawdziwej pracy”. Przeczytajcie to jeszcze raz: do prawdziwej pracy.

SONIC (skrót od Supersizing mOtion tracking for Natural humanoId Control) to „behawioralny model bazowy” (Behavior Foundation Model) służący do generowania ruchów całego ciała w czasie rzeczywistym. Został wytrenowany na gigantycznym zbiorze danych obejmującym ponad 100 milionów klatek z sesji motion capture – to ponad 700 godzin nagrań ludzi biegających, skaczących i czołgających się. Dzięki temu roboty zyskują fundamentalne zrozumienie naturalnej motoryki bez konieczności żmudnego, ręcznego projektowania systemów nagród dla każdego konkretnego zadania. System wspiera zarówno bezpośrednie zdalne sterowanie (teleoperację), jak i wnioskowanie z modeli Vision-Language-Action (VLA), co pozwala jednej, spójnej strukturze kontrolować całą maszynę.

Co istotne, to nie jest tylko akademicka teoria. Jeden z beta-testerów donosi, że wdrożenie systemu zajęło mu zaledwie kilka godzin, a jego wydajność określił jako „bezkonkurencyjną”. W dziedzinie, w której precyzyjne dostrajanie kontrolerów zajmowało zazwyczaj całe miesiące, czas konfiguracji liczony w godzinach brzmi niemal jak cud.

Dlaczego to ma znaczenie?

Przez lata robotyka humanoidalna utknęła w pętli efektownych demówek – oglądaliśmy imponujące, ale kruche popisy zwinności, które rzadko przekładały się na realne zastosowania. Udostępniając potężny, uniwersalny kontroler jako open-source, NVIDIA de facto standaryzuje fundamenty ruchu robotów. To drastycznie obniża próg wejścia dla startupów i naukowców, pozwalając im skupić się na „wyższych funkcjach poznawczych” i wykonywaniu konkretnych zadań, zamiast po raz setny wymyślać koło na nowo. To strategiczny ruch, ściśle powiązany z szerszą inicjatywą Nvidii – Project GR00T (Generalist Robot 00 Technology) – mającą na celu stworzenie uniwersalnej platformy programowej i AI dla robotów nowej generacji. Era robienia salt pod publiczkę powoli dobiega końca. Nadchodzi czas robotów, które – choć może mniej widowiskowo – w końcu po prostu pozmywają naczynia.