Unitree: Nowy model AI uczy humanoida breakdance'u

W świecie robotyki, gdzie większość pokazów przypomina sztywno wyreżyserowane i do bólu powtarzalne układy, pojawiło się coś, co wywraca stolik. Badacze zaprezentowali OmniXtreme – uniwersalny model sterowania (policy) oparty na AI, który pozwala humanoidalnym robotom na wykonywanie seryjnych salt, balansowanie w karkołomnych pozycjach, a nawet… breakdance. Ten pokaz sprawności, zademonstrowany na modelu G1 od Unitree Robotics, to coś znacznie więcej niż „przetrenowane” pod publiczkę demo, jakie widzieliśmy w wykonaniu WuBOT podczas gali chińskiego Nowego Roku w 2026 roku. To narodziny prawdziwie wszechstronnego, robotycznego atlety.

Ten trwający rok projekt, realizowany we współpracy z Unitree, miał jednak swoją cenę. Zespół badawczy przyznał bez bicia, że aby złamać kod odpowiedzialny za tak dynamiczne ruchy, musiał „posłać na złom” dziesiątki robotów G1. Biorąc pod uwagę, że cena wejścia dla modelu G1 to około 13 500 dolarów (ok. 55 000 PLN), mówimy o całkiem sporej ofierze złożonej na ołtarzu uczenia ze wzmocnieniem (reinforcement learning). Cel był jednak ambitny: pokonać barierę oddzielającą algorytmy szkolone pod konkretny ruch od systemów, które potrafią okiełznać chaotyczną fizykę ekstremalnych ewolucji w prawdziwym świecie.

„Tajemnym składnikiem” sukcesu jest dwuetapowa metoda szkolenia. Najpierw model przechodzi trening wstępny oparty na generatywnym sterowaniu (flow-based generative control), co daje robotowi fundamentalne zrozumienie ruchu. Następnie następuje etap „post-training” z wykorzystaniem techniki „actuation-aware residual RL”. To właśnie ten krytyczny krok pozwala modelowi uwzględnić skomplikowaną dynamikę i fizyczne ograniczenia rzeczywistej maszyny. Badacze podkreślają, że to właśnie ten drugi etap był kluczem do udanego transferu umiejętności z symulacji do rzeczywistości (tzw. sim-to-real). Co ważne dla całej społeczności, model został udostępniony w formie open-source na GitHubie.

Dlaczego to przełom?

Stworzenie jednej, spójnej polityki sterowania dla tak szerokiego wachlarza wymagających ruchów to kamień milowy. To wyraźny sygnał, że era robotycznych „specjalistów”, potrafiących wykonać tylko jedną efektowną sztuczkę, dobiega końca. Nadchodzi czas „generalistów” o szerokim repertuarze umiejętności fizycznych. Skutecznie mostując trudną do pokonania przepaść sim-to-real w ekstremalnych warunkach, OmniXtreme dostarcza gotowy fundament pod budowę bardziej wytrzymałych, adaptacyjnych i sprawnych robotów humanoidalnych. Dzięki upublicznieniu modeli, wyścig o stworzenie wielozadaniowych robotycznych gimnastyków i tancerzy przyszłości właśnie wrzucił wyższy bieg.