Helix 02 od Figure: Koniec z kodem, czas na zmywanie naczyń

Przez lata roboty humanoidalne były jak niezdarne nastolatki świata technologii: świetnie radziły sobie w wyreżyserowanych układach tanecznych i saltach, ale stawały się beznadziejnie zagubione, gdy przyszło do wykonania prostego domowego obowiązku. Branża robotyki od dawna tkwiła w martwym punkcie zwanym „loco-manipulation” – to ten piekielnie złożony problem polegający na tym, by robot jednocześnie chodził i używał rąk, nie zmieniając się przy tym w stertę drogich części i gorzkich żalów.

Wtedy wchodzi Figure AI ze swoim najnowszym modelem Helix 02. To nie jest kolejna maszyna, która ledwo potrafi zrobić dwie rzeczy naraz. Helix 02 chodzi, przenosi delikatne naczynia i opróżnia zmywarkę w nieprzerwanej, czterominutowej, w pełni autonomicznej sekwencji. To nie jest kolejny wygładzony, krótki demo-klip. To dowód na to, że pojedyncza sieć neuronowa może kontrolować całe ciało humanoidu – od analizy pikseli po moment obrotowy silników – ostatecznie zasypując przepaść między lokomocją a manipulacją.

Koniec robotów „zszytych z kawałków”

Tradycyjnie sprawienie, by humanoid zrobił cokolwiek pożytecznego, wymagało stworzenia topornego, programistycznego potwora Frankensteina. Jeden sterownik odpowiadał za chodzenie, przekazywał pałeczkę kolejnemu odpowiedzialnemu za stabilizację, a ten z kolei trzeciemu, który zajmował się sięganiem i chwytaniem. Efekt? Proces powolny, sztywny i skrajnie nienaturalny. Wystarczyło, że obiekt przesunął się niespodziewanie o centymetr, a cała ta krucha wieża logiki waliła się w gruzy.

„Prawdziwa autonomia wymaga czegoś fundamentalnie innego: jednego systemu uczącego się, który analizuje całe ciało jednocześnie” – czytamy w ogłoszeniu Figure. „Systemu, który nieustannie postrzega, decyduje i działa”.

To właśnie ten problem ma rozwiązać Helix 02. Zamiast łączyć odrębne systemy, Figure stworzyło hierarchiczną architekturę AI, która myśli i działa jako spójna całość.

Trójwarstwowy mózg w mechanicznym ciele

Magia Helix 02 tkwi w architekturze trzech systemów, z których każdy operuje w innej skali czasowej. Można to porównać do korporacyjnej drabiny: od prezesa ustalającego strategię, po stażystę wykonującego czarną robotę.

  • System 2 (Strateg): To warstwa rozumowania wysokiego poziomu. Analizuje otoczenie i język, rozbijając polecenie typu „opróżnij zmywarkę” na sekwencję celów. Działa powoli, skupiając się na szerszym kontekście.
  • System 1 (Taktyk): To polisa wizyjno-motoryczna, która łączy wszystkie zmysły robota – kamery w głowie, nowe kamery w dłoniach i czujniki dotyku w palcach – ze wszystkimi jego stawami. Przekłada cele Systemu 2 na błyskawiczne komendy dla całego ciała z częstotliwością 200 Hz.
  • System 0 (Atleta): To fundament, model wytrenowany na ponad 1000 godzin danych dotyczących ruchu człowieka. Działa z zawrotną prędkością 1 kHz, dbając o to, by każdy ruch był stabilny, wyważony i naturalny. W imponującym geście dominacji Figure zaznacza, że System 0 zastępuje 109 504 linie ręcznie pisanego kodu w C++ jedną siecią neuronową. W zasadzie wyrzucili do kosza całą bibliotekę kodu i zatrudnili AI, które nauczyło się poruszać, „podglądając” ludzi.
Video thumbnail

Ten rurociąg „od pikseli do całego ciała” pozwala robotowi wykonać 61 różnych akcji loco-manipulacyjnych podczas czterominutowego „zmywarkowego baletu”. Maszyna płynnie przechodzi od chodzenia do przenoszenia i odkładania przedmiotów, a nawet używa biodra, by zamknąć szufladę, gdy ma zajęte ręce.

Co on właściwie potrafi?

Zadanie ze zmywarką to główna gwiazda pokazu, ale wprowadzenie nowego sprzętu w robocie Figure 03 – a konkretnie kamer w dłoniach i czujników dotyku – odblokowuje zupełnie nowy poziom zręczności. Te sensory dają Helix 02 informację zwrotną niezbędną do zadań, które wcześniej były poza zasięgiem systemów opartych wyłącznie na wzroku.

Czujniki dotyku potrafią wykryć siłę nacisku rzędu zaledwie trzech gramów – to wystarczy, by „poczuć” spinacz biurowy. To otwiera drzwi do całej klasy precyzyjnych umiejętności motorycznych.

Zręczność wykraczająca poza kuchnię

Helix 02 przeszedł przez prawdziwy poligon doświadczalny, by udowodnić swoją precyzję:

  • Odkręcanie nakrętki butelki: Wymaga precyzyjnej koordynacji obu rąk i kontroli siły, by nie zgnieść butelki.
  • Wyjmowanie pojedynczej tabletki z organizera: Wykorzystuje kamery w dłoniach do zbliżeń w sytuacjach, gdy główne kamery w głowie mają zasłonięty widok.
  • Odważanie dokładnie 5 ml ze strzykawki: Zadanie wymagające czucia dotykowego, by zastosować płynną, jednostajną siłę.
  • Wyławianie metalowych części z chaotycznego pojemnika: Realne zadanie z własnej fabryki Figure (BotQ), pokazujące zdolność do pracy w brudnym, nieprzewidywalnym środowisku.

Analiza: Skok cywilizacyjny dla użytecznych humanoidów

Podczas gdy inne firmy chwalą się robotami wykonującymi imponujące akrobacje, Figure skupia się na mało efektownym, ale krytycznym wyzwaniu: sprawieniu, by humanoidy były przydatne w realnym świecie. Przeskok od oryginalnego modelu Helix, który kontrolował tylko górną połowę ciała, do pełnej autonomii całego organizmu w Helix 02 w zaledwie rok, to wymowny wskaźnik tempa postępu w tej dziedzinie.

Kluczowym wnioskiem jest odejście od sztywnych, ręcznie kodowanych zachowań na rzecz wyuczonego, adaptacyjnego systemu. Trenując swój model bazowy na ogromnym zbiorze danych o ludzkim ruchu, Figure zaszczepia maszynie naturalną wiedzę o tym, jak dwunożna forma powinna się poruszać i trzymać pion. Dzięki temu AI wyższego poziomu może skupić się na tym, co zrobić, podczas gdy system niższego poziomu zajmuje się tym, jak to wykonać.

Tu nie chodzi o zbudowanie robota, który idealnie robi jedną rzecz, ale o stworzenie platformy, która może nauczyć się robić wszystko. Jak zauważył CEO Figure, Brett Adcock, ulepszenia sieci neuronowej Helix mogą być przesyłane do całej floty, pozwalając wszystkim robotom czerpać korzyści z doświadczeń jednego z nich. Biorąc pod uwagę, że siłowniki robota pracują obecnie na zaledwie 20-25% swojej maksymalnej prędkości, obecny sprzęt ma jeszcze gigantyczny zapas mocy.

Wyniki są wciąż na wczesnym etapie, ale stanowią fundamentalną zmianę paradygmatu. Rozwiązując problem ciągłej autonomii całego ciała, Figure zrobiło milowy krok w stronę stworzenia prawdziwego robota ogólnego przeznaczenia – takiego, który w końcu może być gotowy, by wyręczyć nas w obowiązkach, bez potrzeby pisania tysięcy linii sztywnego kodu.