Uczeń przerósł mistrza: Humanoidalny robot Unitree G1 ogrywa ludzi w tenisa dzięki „niedoskonałym” danym
W scenariuszu, który dla nikogo śledzącego rozwój AI nie powinien być zaskoczeniem, badacze stworzyli robota, który opanował nową umiejętność tak dobrze, że błyskawicznie pokonał swojego nauczyciela. Tym razem padło na tenis, a projekt o nazwie LATENT udowodnił, że humanoidy wcale nie potrzebują sterylnych danych od profesjonalistów, by stać się groźnymi rywalami na korcie. Zamiast tego, maszyna uczyła się na podstawie niedoskonałych nagrań ludzkich ruchów. Efekt? Robot, który bez problemu radzi sobie w wielouderzeniowych wymianach.
Projekt, prowadzony przez naukowców z Uniwersytetu Tsinghua oraz firmy Galbot Inc., uderza w jeden z najczulszych punktów współczesnej robotyki: naukę złożonych, dynamicznych ruchów bez posiadania idealnej „instrukcji obsługi”. Ich system uczy się tzw. „ukrytej przestrzeni akcji” (latent action space) na bazie sfragmentaryzowanych i dalekich od ideału wzorców ludzkiego ruchu. Kluczem do sukcesu jest wysokopoziomowa strategia AI, która pełni rolę cyfrowego trenera – koryguje błędy i łączy te niedoskonałe fundamenty w spójną całość, pozwalającą skutecznie przebić piłkę nad siatką. Cały proces jest szlifowany w symulacji, a następnie przenoszony na fizycznego robota Unitree G1 za pomocą techniki sim-to-real.

Prawdziwym sprawdzianem była jednak praktyka na korcie. Jak przyznaje główny autor projektu, Zhikai Zhang, krzywa uczenia się była wyjątkowo stroma. „Pierwszego dnia testów w świecie rzeczywistym robot nie potrafił odebrać ani jednej piłki, którą mu zaserwowałem” – wspomina Zhang. „Ostatniego dnia projektu nie byłem już w stanie z nim wygrać”. Dla tych, którzy chcieliby zgłębić techniczne detale lub spróbować wytrenować własnego mechanicznego pogromcę kortów, zespół udostępnił szczegóły projektu oraz kod źródłowy. Linki: Strona projektu oraz Repozytorium GitHub.
Dlaczego to ma znaczenie?
To coś więcej niż tylko stworzenie sparingpartnera dla samotnych tenisistów. Prawdziwym przełomem w systemie LATENT jest zdolność uczenia się na podstawie „brudnych”, nieprecyzyjnych danych. Większość systemów treningowych dla robotów wymaga skrupulatnie przygotowanych, sterylnych zbiorów danych, których stworzenie jest ekstremalnie drogie i czasochłonne. Dzięki umiejętności korygowania i łączenia wadliwych przykładów, to podejście może drastycznie przyspieszyć naukę złożonych zadań w świecie rzeczywistym. To milowy krok w stronę robotów, które będą uczyć się „w biegu” w nieprzewidywalnych warunkach – od magazynów po strefy klęsk żywiołowych – nie potrzebując za każdym razem idealnego pokazu umiejętności ze strony człowieka.













