Souboj architektur: KinetIQ od Humanoidu vs. Helix 02 od Figure

V závodu o vytvoření definitivního umělého mozku pro humanoidní roboty se začíná rýsovat fascinující filozofické schizma. Už dávno nejde jen o to, kdo přiměje robota chodit nebo podat plechovku coly. Skutečná válka se nyní odehrává v samotné architektuře jejich mysli. Na jedné straně stojí zázračné dítě – „end-to-end“ génius, který se učí pouhým pozorováním. Na straně druhé máme precizně organizovanou hierarchii. A právě do tohoto druhého tábora sebevědomě vstupuje společnost Humanoid se svým novým AI frameworkem KinetIQ. Systémem, který nemá za úkol řídit jen jednoho robota, ale rovnou celý jejich orchestr.

Tím se okamžitě schyluje k napínavému střetu s Figure AI, jejíž Helix 02 od Figure: Místo kódu má mozek, co umyje i nádobí ohromil publikum svou plynulou, dlouhodobou autonomií. Zatímco Figure sází na vytvoření jediné, sjednocené neuronové sítě, která se učí komplexní víceúrovňové úkoly, Humanoid řeší podstatně špinavější a průmyslovější problém: management celých flotil. Je to souboj mezi virtuózním sólistou a generálním dodavatelem. Výsledek tohoto klání může na desetiletí definovat, jak se roboti integrují do našeho světa.

KinetIQ: Korporátní žebříček kognice

KinetIQ od Humanoidu stojí na něčem, co autoři nazývají „cross-timescale“ architekturou. To je v podstatě vznešený výraz pro čtyřpatrový dort příkazů a řízení. Je to agentní framework, který uvažuje jako korporace – každá vrstva operuje s jinou rychlostí a na jiné úrovni abstrakce.

Na samotném vrcholu sedí System 3, neboli Agentic Fleet Orchestrator. To je „C-suite“ celého systému. Integruje se se softwarem pro správu továren či skladů a přijímá cíle na vysoké úrovni. Pracuje v časovém horizontu sekund až minut a s každým robotem v různorodé flotile – ať už jde o dvounohé stroje nebo ty na kolečkách – nakládá jako se zdrojem, který je třeba nasadit s maximální efektivitou.

O patro níž najdeme System 2, projektového manažera na úrovni konkrétního robota. Tato vrstva využívá omnimodální jazykový model k interpretaci příkazů ze System 3 a rozkládá je na sekvenci podúkolů pro jeden stroj. Dokáže uvažovat o okolním prostředí a dynamicky měnit plány – v podstatě řeší problémy za pochodu.

Instrukce pro každý okamžik pak vydává System 1, síť typu Vision-Language-Action (VLA), která funguje jako vedoucí týmu. Běží na svižné frekvenci 5–10 Hz a generuje nepřetržitý proud cílových póz pro jednotlivé části těla robota – ruce, trup, pánev – tak, aby naplnila plán ze System 2.

A konečně tu máme černou práci, kterou odvádí System 0. To je kontrolér celého těla (whole-body controller), běžící na 50 Hz. Byl trénován výhradně pomocí 15 000 hodin posilovaného učení (reinforcement learning) v simulaci. Jeho jediným, takřka zběsilým úkolem je překládat cílové pózy shora do stabilních, vyvážených pohybů kloubů. Zajišťuje zkrátka, aby se robot při pokusu o zvednutí krabice nerozmázl o zem.

Video thumbnail

Helix 02: End-to-End virtuóz

V druhém rohu ringu stojí Helix 02 od Figure AI, systém s fundamentálně odlišnou filozofií. Místo vícevrstvé byrokracie je Helix 02 postaven kolem jediné, sjednocené visuomotorické neuronové sítě. Jeho mantra zní: „všechny senzory dovnitř, všechny aktuátory ven“. Zrak, hmat i propriocepce jsou propojeny přímo s každým kloubem v jednom spojitém systému.

Ačkoliv je Helix také hierarchický, jeho struktura je mnohem komprimovanější:

  • System 2 se stará o sémantické uvažování na vysoké úrovni, podobně jako horní patra KinetIQ.
  • System 1 je místem, kde se dějí kouzla. Je to výkonná „policy“, která překládá vnímání přímo do pohybů celého těla při bleskové frekvenci 200 Hz.
  • System 0 tvoří základ pro fyzické ztělesnění – kontrolér zajišťující hladkost a stabilitu. Na rozdíl od čistě simulovaného přístupu KinetIQ byl System 0 u Helixu trénován na více než 1 000 hodinách dat o lidském pohybu. Naučil se nuance lidské rovnováhy a koordinace, než byl doladěn pomocí RL. Navíc operuje na brutální frekvenci 1 kHz.

Právě tento přístup umožnil společnosti Figure demonstrovat, jak jejich robot autonomně zvládne čtyřminutový úkol plnění a vyprazdňování myčky – což je kousek dlouhodobé autonomie, který v oboru stále platí za zlatý standard.

Příběh dvou mozků: Filozofický rozkol

Rozdíly mezi KinetIQ a Helix 02 nejsou jen technické – představují dvě odlišné vize budoucnosti robotiky.

FunkceHumanoid KinetIQFigure AI Helix 02
Primární cílOrchestrace flotily různých robotůDlouhodobá autonomie u jednotlivého robota
Architektura4vrstvý agentní framework3vrstvá sjednocená visuomotorická síť
Trénink System 0~15 000 hodin čistého Reinforcement Learningu1 000+ hodin lidských dat + RL
Rychlost System 050 Hz1000 Hz (1 kHz)
Klíčová sílaŠkálovatelnost, spolehlivost a správa různých platforem.Plynulost, obratnost a učení se komplexním, novým úkolům.
AnalogieSkvěle řízená logistická firma.Špičkově vytrénovaný sólový atlet.

Agentní, vrstvený design KinetIQ je pragmatický. Díky oddělení kompetencí může Humanoid teoreticky vylepšovat, ladit nebo dokonce vyměnit jednotlivé vrstvy, aniž by musel přestavovat celý systém od základu. Tato modularita je ideální pro průmyslové prostředí, kde je spolehlivost a koordinace mnoha strojů naprosto zásadní.

Přístup „end-to-end“ od Figure je ambicióznější ve své snaze o dosažení obecné inteligence. Tím, že systém trénuje na lidských datech, míří k vytvoření základního modelu (foundation model) pro fyzickou akci, který je přirozeně elegantnější a lépe se přizpůsobí nestrukturovanému chaosu reálného světa. Učí se, jak se hýbat jako člověk, nejen jak dosáhnout cíle.

Skutečný závod: Od nablýskaných dem k opravdové dřině

O tom, která architektura je skutečně nadřazená, se nakonec nerozhodne v laboratoři, ale na podlahách továren a v našich domovech. Humanoid sází na to, že okamžitá miliardová kořist leží v logistice a výrobě, kde je největší výzvou právě orchestrace flotil specializovaných robotů. KinetIQ je pro tento svět jako stvořený.

Figure AI se svým zaměřením na komplexní úkoly orientované na člověka hraje spíše dlouhou hru. Cílí na skutečně univerzálního robota, který se jednoho dne dokáže orientovat v jakémkoliv lidském prostředí. Ohromující zručnost, kterou předvedli – od manipulace s pilulkami až po precizní dávkování injekčních stříkaček – ukazuje systém, který posouvá hranice jemné motoriky.

Závod běží. Bude budoucnost robotiky patřit preciznímu AI manažerovi flotily, nebo virtuóznímu robotickému zázraku? KinetIQ je pádným argumentem pro první možnost – je to systém navržený nikoliv pro virální videa, ale pro drsnou realitu průmyslového nasazení 24/7. Pro více informací si můžete přečíst původní oznámení na thehumanoid.ai.