Szkolenie robotów: ludzcy nauczyciele kontra YouTube

Wyścig o stworzenie zdolnego robota humanoidalnego coraz mniej dotyczy sprzętu, a coraz bardziej fundamentalnego pytania filozoficznego: jak najlepiej uczyć maszynę? Z jednej strony mamy firmy takie jak Sunday, stawiające wszystko na armię ludzkich nauczycieli. Z drugiej strony giganci pokroju Tesli i Nvidii mają nadzieję, że ich roboty nauczą się po prostu, oglądając YouTube’a. Ten strategiczny rozłam definiuje całą dziedzinę i nikt nie jest zgodny co do właściwej odpowiedzi.

Sunday stawia wszystko na naukę przez naśladowanie, wyposażając 500 “deweloperów pamięci” w specjalne rękawice, aby skrupulatnie rejestrowali wysokiej jakości dane dla każdej możliwej czynności. Firma twierdzi, że ta metoda pozwala jej trenować i oceniać nowe zadanie co jeden do dwóch tygodni, tworząc to, co nazywa “najszybciej uczącym się robotem na świecie”. To praktyczne, niemal rzemieślnicze podejście do zbierania danych, koncentrujące się na jakości, a nie na samej ilości.

Video thumbnail

Ten model zorientowany na człowieka ma swoje wariacje. Norweska firma 1X Technologies również korzysta z ludzkich wskazówek, ale zamiast rękawic i starannie przygotowanych sesji, wysyła swoje 1X Neo: Twój lokaj AI jest tutaj, za odpowiednią cenę roboty bezpośrednio w realne scenariusze, aby uczyły się poprzez teleoperację. To mniej klasa szkolna, a bardziej praktyka zawodowa w terenie. Tymczasem Figure buduje fizyczne “Neura Gyms”, czyli ustrukturyzowane środowiska, w których jej roboty mogą trenować konkretne zadania, czasem we współpracy z firmami takimi jak BMW.

Potem mamy obóz “po prostu oglądaj filmy”. Tesla głośno mówi o swoim celu, aby bot Optimus uczył się zadań po prostu, obserwując filmy, na których wykonują je ludzie. Nvidia, ze swoją platformą NVIDIA tworzy Matriks dla robotów z Cosmos , również wykorzystuje symulacje i ogromne, dostępne w internecie dane wideo do trenowania swoich modeli bazowych dla robotyki. Ta metoda obiecuje olbrzymią skalę – w internecie jest więcej godzin filmów instruktażowych niż jakikolwiek zespół deweloperów pamięci byłby w stanie wyprodukować – ale boryka się z kontekstem, ucieleśnieniem i samym szumem nieustrukturyzowanych danych.

Dlaczego to jest ważne?

Rozłam w metodologii szkoleniowej stanowi największą przeszkodę w stworzeniu prawdziwie uniwersalnego robota. Sedno debaty to klasyczny problem jakości kontra ilości, spotęgowany przez złożoność interakcji fizycznych.

Czy drobiazgowo przygotowany, wysokiej jakości zbiór danych od ludzkich demonstratorów – taki, jaki buduje Niedzielne AI pomija roboty-marionetki, uczy sprzątania ręcznie – jest kluczem do niezawodnego wykonywania zadań? Czy może sama, chaotyczna objętość danych internetowych ostatecznie zapewni bardziej solidną i skalowalną ścieżkę do inteligencji, jak wierzą Tesla i Nvidia? Firma, która rozwiąże tę skalowalną zagadkę uczenia się, nie tylko zbuduje lepszego robota; najprawdopodobniej zdefiniuje kolejną dekadę sztucznej inteligencji i automatyzacji.