Nowy AI od 1X przewiduje przyszłość, pozwalając robotom ćwiczyć w Matrixie

Jak nauczyć humanoidalnego robota wartego miliony, by nie pomylił kota z kłaczkiem kurzu?

Zastanawiałeś się kiedyś, jak nauczyć robota humanoidalnego wartego miliony dolarów, aby nie mylił twojego kota z kłębkiem kurzu? Albo jak sprawić, by otworzył oporny słoik ogórków bez wyrywania drzwiczek szafki z zawiasów? Mógłbyś spędzić całe życie, pozwalając mu ćwiczyć w prawdziwym świecie, gromadząc komiczną (i kosztowną) kolekcję wpadek.

Albo, jeśli jesteś firmą robotyczną 1X, po prostu budujesz dla swoich robotów własny Matrix.

Dziś firma 1X zaprezentowała swój Model Świata 1X (1XWM), przełomową sztuczną inteligencję, która działa jako pomost między światem atomów a światem bitów. To symulator o wysokiej wierności, który potrafi przewidywać przyszłość, pozwalając ich humanoidalnym robotom NEO ćwiczyć, popełniać błędy i uczyć się w cyfrowym środowisku, zanim wykonają pierwszy krok w twoim domu.

To nie jest kolejny silnik gry wideo. To kryształowa kula dla robotyki, która rozwiązuje jeden z największych problemów w tworzeniu prawdziwie autonomicznych androidów.

Problem: testowanie w rzeczywistości jest koszmarem

Ostatecznym celem 1X jest wprowadzenie robotów NEO do najbardziej chaotycznego środowiska, jakie można sobie wyobrazić: naszych domów. Miejsca, gdzie kluczyki do samochodu tajemniczo się teleportują, meble są przestawiane zgodnie z zachcianką, a ten jeden konkretny dekiel od pojemnika Tupperware zaginął jeszcze w 2019 roku.

Testowanie programowania robota (czyli “polityki”) dla każdego możliwego scenariusza jest fizycznie niemożliwe. Nie da się stworzyć miliona różnych zastawionych kuchni. Jak ujmuje to 1X, “fizyczna ocena każdej polityki… zajęłaby kilka ludzkich żywotów.”

1XWM: cyfrowa kryształowa kula dla robotów

Model Świata 1X jest odpowiedzią. Bierze rzeczywisty punkt wyjścia — kilka klatek wideo z pomieszczenia — a następnie przewiduje, co stanie się dalej w oparciu o konkretne działania robota.

A oto kluczowa różnica w porównaniu do typowej sztucznej inteligencji typu “tekst-na-wideo”: 1XWM jest sterowalny działaniami. Nie podajesz mu niejasnego polecenia typu “wyczyść blat”. Wprowadzasz dokładną, niskopoziomową trajektorię działania robota — precyzyjne kąty jego stawów, prędkość ramienia, siłę chwytu. Model następnie symuluje konsekwencje, uwzględniając fizykę ściereczki wycierającej powierzchnię czy drzwi obracających się na zawiasach.

Wyniki są oszałamiające. Model może generować wiele różnych przyszłości z tego samego punktu wyjścia, pokazując, co się stanie, jeśli NEO chwyci kubek lub, dajmy na to, zagra na wyimaginowanej gitarze. Pozwala to 1X przeprowadzać miliony eksperymentów w ułamku czasu, testując swoją sztuczną inteligencję bez przesuwania choćby jednego przedmiotu w prawdziwym świecie.

Matrix bez żargonu: krótki przewodnik

Czujesz się, jakbyś właśnie połknął czerwoną pigułkę? Wyjaśnijmy kluczowe pojęcia.

Czym jest “Model Świata”? Wyobraź go sobie jako wewnętrzną wyobraźnię sztucznej inteligencji. To symulacja tego, jak działa świat, pozwalająca SI przewidzieć “co stanie się dalej”, jeśli wykona określone działanie. To różnica między uczeniem się metodą prób i błędów a przemyśleniem konsekwencji z góry.

Czym jest “Polityka Robota”? Mówiąc prosto, to mózg robota lub strategia podejmowania decyzji. To złożony zestaw reguł, który mówi robotowi, jaką akcję podjąć na podstawie tego, co widzi, słyszy i czuje. Model Świata służy do szybkiej oceny, która “polityka” jest najlepsza.

Co oznacza “Sterowalny Działaniami”? Oznacza to, że symulacja jest kierowana przez dokładne, precyzyjne ruchy robota, a nie przez ogólne polecenie tekstowe. Jest to kluczowe dla realistycznego symulowania fizyki. Model musi wiedzieć, czy robot próbuje pchnąć drzwi, czy je pociągnąć.

Czym jest “Propriocepcja”? To zmysł robota dotyczący własnego ciała. Wie, gdzie znajdują się jego kończyny, pod jakim kątem są ustawione jego stawy i jak porusza się w przestrzeni bez konieczności “widzenia” siebie. To nasz ludzki zmysł dotyku i równowagi, ale dla robota. 1X odkrył, że polityki wykorzystujące propriocepcję działają znacznie lepiej.

Czym są “Kontrfaktyczne Scenariusze”? To scenariusze typu “co by było, gdyby”. Model Świata może wziąć sytuację, w której robot zawiódł w prawdziwym świecie i zasymulować, co stałoby się, gdyby podjął inne działanie. To jak posiadanie machiny czasu do trenowania robotów.

Od wirtualnych ćwiczeń do inteligencji w prawdziwym świecie

Czy więc te wszystkie cyfrowe marzenia naprawdę tworzą lepszego robota? Według 1X odpowiedź brzmi zdecydowanie tak.

Istnieje wysoka korelacja między przewidywaniami Modelu Świata a wynikami w rzeczywistości. Kiedy symulator przewidział, że jedna wersja SI będzie lepsza w wykonywaniu zadania niż inna, oceny w prawdziwym świecie potwierdziły to. Ta natychmiastowa pętla sprzężenia zwrotnego jest rewolucyjna, pozwalając im:

  • Wybierać najlepsze mózgi: Szybko wybierać najlepiej działający model SI z serii treningowej, bez długotrwałych testów fizycznych.
  • Uczyć się na błędach: Tworzyć zbiory danych z niepowodzeń w prawdziwym świecie i wykorzystywać model do analizowania, co robot powinien był zrobić inaczej.
  • Skalować naukę: Im więcej danych model widzi, tym staje się mądrzejszy. Może nawet przenosić wiedzę z jednego zadania na drugie — doskonalenie obsługi półki pomaga mu zrozumieć automat do gier.

Oczywiście, nie jest idealny. 1X otwarcie mówi o jego ograniczeniach. Model obecnie ma trudności z symulowaniem interakcji z obiektami, których nigdy wcześniej nie widział. Ale wraz ze wzrostem ilości danych treningowych, oczekuje się, że ta “luka wyobraźni” będzie się zmniejszać.

Przyszłość jest syntetyczna

Plan końcowy dla 1X jest monumentalny. Wierzą, że wystarczająco zaawansowany Model Świata mógłby generować dane syntetyczne, które są nie do odróżnienia od danych ze świata rzeczywistego.

Kiedy to nastąpi, wąskie gardło danych, które nękało robotykę przez dziesięciolecia, mogłoby zniknąć. Nie musisz już spędzać lat na zbieraniu danych; możesz generować nieograniczone, idealnie dopasowane scenariusze treningowe wewnątrz modelu.

Jak stwierdza zespół 1X: “Dane i oceny są kamieniem węgielnym rozwiązania problemu autonomii, a 1XWM zapewnia jednolity sposób na rozwiązanie obu wyzwań.”

To śmiała wizja: przyszłość, w której androidy są trenowane nie tylko w prawdziwym świecie, ale w cyfrowym świecie ich własnym — Matrix, który przygotowuje je na nasz. A jak zawsze, magazyn RoboHorizon będzie tu, by relacjonować, jak ta symulowana przyszłość staje się naszą rzeczywistością.