W morderczym wyścigu o stworzenie ostatecznego, cyfrowego mózgu dla humanoidalnych robotów, na naszych oczach rodzi się fascynująca schizma filozoficzna. Tu nie chodzi już tylko o to, czyja maszyna potrafi sprawniej chodzić albo przynieść puszkę coli. Prawdziwa wojna toczy się o samą architekturę umysłu. Z jednej strony mamy genialnego samouka – system typu end-to-end, który chłonie wiedzę przez obserwację. Z drugiej: skrupulatnie zorganizowaną, wielopoziomową biurokrację. W tym drugim obozie pewnym krokiem rozgaszcza się Humanoid ze swoim nowym frameworkiem AI o nazwie KinetIQ. To system zaprojektowany nie po to, by sterować jednym robotem, ale by dyrygować całą ich orkiestrą.
To od razu ustawia nas w samym środku pasjonującego starcia z Figure AI, którego Helix 02 od Figure: Koniec z kodem, czas na zmywanie naczyń oczarował publiczność płynną, długofalową autonomią. Podczas gdy Figure skupia się na stworzeniu jednej, zunifikowanej sieci neuronowej, która uczy się złożonych, wieloetapowych zadań, Humanoid bierze się za bary z problemem znacznie mniej medialnym, za to kluczowym dla przemysłu: zarządzaniem flotą. To pojedynek wirtuoza z generalnym wykonawcą, a jego wynik może zdefiniować sposób, w jaki roboty zintegrują się z naszym światem na nadchodzące dekady.
KinetIQ: Korporacyjna drabina poznawcza
KinetIQ od Humanoid opiera się na architekturze, którą twórcy nazywają „cross-timescale” (między-skalową). Mówiąc po ludzku: to czterowarstwowy tort dowodzenia i kontroli. To framework agentowy, który myśli jak nowoczesna korporacja, gdzie każda warstwa operuje z inną prędkością i na innym poziomie abstrakcji.
Na samym szczycie zasiada System 3, czyli Agentowy Orkiestrator Floty. To tutejszy zarząd (C-suite), integrujący się z oprogramowaniem do zarządzania fabryką lub magazynem, by odbierać ogólne wytyczne. Działa w skali od sekund do minut, traktując każdego robota w zróżnicowanej flocie – nieważne, czy dwunożnego, czy kołowego – jako zasób, który należy rozmieścić z maksymalną efektywnością.
Szczebel niżej znajduje się System 2, czyli robotyczny kierownik projektu. Ta warstwa wykorzystuje omnimodalny model językowy, by interpretować dyrektywy z Systemu 3 i rozbijać je na sekwencję podzadań dla konkretnej maszyny. System ten analizuje otoczenie i potrafi dynamicznie zmieniać plan, w zasadzie rozwiązując problemy na bieżąco.
Instrukcje „tu i teraz” wydaje System 1, sieć typu Vision-Language-Action (VLA), pełniąca rolę lidera zespołu. Operując z żwawą częstotliwością 5–10 Hz, generuje ona ciągły strumień docelowych pozycji dla poszczególnych części ciała robota – rąk, tułowia, miednicy – tak, aby zrealizować plan nakreślony przez System 2.
I wreszcie, za czarną robotę odpowiada System 0. To kontroler całego ciała (whole-body controller), pracujący z częstotliwością 50 Hz, wytrenowany wyłącznie na drodze około 15 000 godzin uczenia przez wzmacnianie (reinforcement learning) w symulacji. Jego jedynym, gorączkowym celem jest przełożenie celów ruchowych z góry na stabilne, wyważone ruchy stawów, dbając o to, by robot nie wywinął orła podczas próby podniesienia skrzynki.

Helix 02: Wirtuoz podejścia End-to-End
W drugim narożniku stoi Helix 02 od Figure AI – system o fundamentalnie innej filozofii. Zamiast wielowarstwowej biurokracji, Helix 02 jest zbudowany wokół jednej, zunifikowanej sieci neuronowej wizyjno-ruchowej. Jego mantra brzmi: „wszystkie czujniki na wejściu, wszystkie siłowniki na wyjściu”. System łączy wzrok, dotyk i propriocepcję bezpośrednio z każdym stawem w ramach jednego, ciągłego organizmu.
Choć tu również mamy do czynienia z hierarchią, jej struktura jest znacznie bardziej skondensowana:
- System 2 zajmuje się wysokopoziomowym rozumowaniem semantycznym, podobnie jak górne warstwy KinetIQ.
- System 1 to miejsce, w którym dzieje się magia. To potężna polityka sterowania, która przekłada percepcję bezpośrednio na ruchy całego ciała z zawrotną częstotliwością 200 Hz.
- System 0 stanowi fundament fizycznego ucieleśnienia – to kontroler dbający o płynność i stabilność. Jednak w przeciwieństwie do czystego uczenia przez wzmacnianie w KinetIQ, System 0 w Helixie został wytrenowany na ponad 1000 godzinach danych z ruchu ludzkiego. Dzięki temu robot nauczył się niuansów ludzkiej równowagi i koordynacji, zanim jeszcze został dopracowany metodą RL. Co więcej, operuje on z oszałamiającą częstotliwością 1 kHz.
To właśnie to podejście pozwoliło Figure zademonstrować robota autonomicznie ładującego i opróżniającego zmywarkę przez cztery minuty – co w kategorii długofalowej autonomii pozostaje punktem odniesienia dla całej branży.
Opowieść o dwóch mózgach: Filozoficzny podział
Różnice między KinetIQ a Helix 02 nie są tylko techniczne – reprezentują one dwie odmienne wizje przyszłości robotyki.
| Cecha | Humanoid KinetIQ | Figure AI Helix 02 |
|---|---|---|
| Główny cel | Orkiestracja floty różnorodnych robotów | Długofalowa autonomia pojedynczego robota |
| Architektura | 4-warstwowy framework agentowy | 3-warstwowa zunifikowana sieć wizyjno-ruchowa |
| Trening Systemu 0 | ~15 000 h czystego Reinforcement Learning | 1000+ h ludzkich ruchów + RL |
| Szybkość Systemu 0 | 50 Hz | 1000 Hz (1 kHz) |
| Kluczowa siła | Skalowalność, niezawodność i zarządzanie różnymi platformami. | Płynność, zręczność i nauka złożonych, nowych zadań. |
| Analogia | Świetnie zarządzana firma logistyczna. | Wysoko wyspecjalizowany solista-sportowiec. |
Agentowa, warstwowa konstrukcja KinetIQ jest pragmatyczna. Dzięki separacji kompetencji, Humanoid może teoretycznie ulepszać, debugować, a nawet wymieniać poszczególne warstwy bez konieczności przebudowy całego systemu. Ta modułowość jest idealna dla środowisk przemysłowych, gdzie niezawodność i koordynacja wielu maszyn są absolutnym priorytetem.
Podejście end-to-end od Figure jest bardziej ambitne w swoim dążeniu do ogólnej inteligencji (AGI). Trenując system na ludzkich danych, firma dąży do stworzenia fundamentalnego modelu działania fizycznego, który jest z natury bardziej pełen gracji i lepiej adaptuje się do nieustrukturyzowanego chaosu świata rzeczywistego. Ten robot uczy się jak poruszać się jak człowiek, a nie tylko jak osiągnąć cel.
Prawdziwy wyścig: Od efektownych demówek do brudnej roboty
Ostatecznie o tym, która architektura jest lepsza, nie zadecydują laboratoria, lecz hale fabryczne i nasze domy. Humanoid obstawia, że natychmiastowa nagroda warta miliardy dolarów czeka w logistyce i produkcji, gdzie głównym wyzwaniem jest dyrygowanie flotami wyspecjalizowanych robotów. KinetIQ został stworzony właśnie dla tego świata.
Figure AI, skupiając się na złożonych zadaniach skoncentrowanych na człowieku, zdaje się grać w dłuższą grę. Celem jest prawdziwie uniwersalny robot, który pewnego dnia odnajdzie się w każdym ludzkim środowisku. Oszałamiająca zręczność, którą zademonstrowano – od przekładania tabletek po precyzyjne operowanie strzykawkami – pokazuje system, który przesuwa granice motoryki małej.
Wyścig trwa. Czy przyszłością robotyki będzie zarządzał skrupulatny cyfrowy menedżer floty, czy wirtuozerski robotyczny geniusz? KinetIQ to mocny argument za tą pierwszą opcją – system zaprojektowany nie pod viralowe filmiki, ale pod mozolną rzeczywistość przemysłowej służby 24/7. Więcej informacji można znaleźć w oryginalnym ogłoszeniu na stronie [thehumanoid.ai](https://thehumanoid.ai/introducing-kinetiq/ “thehumanoid.ai” hreflang=“en”).













