Tenisový robot se naučil z chyb a porazil vlastního tvůrce | RoboHorizon Robot Magazine

V zápletce, která by neměla překvapit nikoho, kdo pozorně sleduje překotný vývoj v AI, přišli vědci s robotem, který se naučil novou dovednost tak bravurně, že okamžitě vypráskal svého vlastního učitele. Oním sportem byl tenis a projekt s názvem LATENT naučil humanoida hrát nikoliv na základě precizních, profesionálních dat, ale z „nedokonalých“ záznamů lidského pohybu. Výsledek? Robot, který v delších výměnách s přehledem drží krok.

Projekt pod vedením výzkumníků z Tsinghua University a společnosti Galbot Inc. se zaměřil na jeden z nejtvrdších oříšků robotiky: jak naučit stroj komplexní a hbité pohyby, aniž byste měli k dispozici dokonalý manuál. Jejich systém se učí v tzv. „latentním akčním prostoru“ z fragmentovaných a zdaleka ne ideálních ukázek lidské hry. Hlavním trumfem je vysokoúrovňová AI strategie, která funguje jako digitální kouč – opravuje a kombinuje tyto nedokonalé základní dovednosti tak, aby robot dokázal úspěšně vrátit míček přes síť. Celý proces se piluje v simulaci, než je pomocí metody sim-to-real transfer nasazen na ostrý hardware, v tomto případě na humanoidního robota Unitree G1.

Diagram znázorňující čtyřfázový proces systému LATENT: předtrénování sledování pohybu, online destilace, učení vysokoúrovňové strategie a přenos ze simulace do reality (sim-to-real).

Chleba se ale láme až v praxi, nebo v tomto případě na výsledkové tabuli. Podle hlavního autora projektu, kterým je Zhikai Zhang, byla křivka učení neuvěřitelně strmá. „První den nasazení v reálném světě robot nedokázal vrátit ani jeden míček, který jsem mu podal,“ přiznal Zhang. „Poslední den projektu už jsem ho nedokázal porazit.“ Pro ty, kteří se chtějí ponořit do technických detailů nebo si snad vytrénovat vlastního tenisového přemožitele, tým zpřístupnil podrobnosti i kód. Odkazy zde: Stránka projektu a GitHub repozitář.

Proč je to důležité?

Tady nejde jen o to, že osamělí tenisoví profíci získali nového parťáka na trénink. Skutečným průlomem systému LATENT je jeho schopnost učit se z „nepořádných“ a neúplných dat. Většina robotických tréninků vyžaduje úzkostlivě vyčištěné datasety, jejichž tvorba je drahá a časově náročná. Tím, že se robot naučí korigovat a kombinovat chybné příklady, může tento přístup dramaticky urychlit výuku komplexních úkolů pro reálný svět. Je to významný krok směrem k robotům, kteří se dokáží učit „za pochodu“ v nepředvídatelném prostředí – od skladů až po záchranné operace v katastrofických zónách – aniž by pokaždé potřebovali naprosto bezchybnou instruktáž.

Proč je to důležité?

Robot zvládá salto ze zdi: Průlom s technologií OmniRetarget

Roboti s umělou inteligencí překonávají lidi v motocyklových kouscích

Kanóny ovládané VR: Úsvit éry mecha válčení

CARA: Revoluce robotických psů poháněných lany

AGIBOT představuje humanoidního robota X2-N inspirovaného Nezhou s kolovou transformací

BOMBA: NVIDIA buduje elitní tým pro humanoidní robotiku v čele s Jimem Fanem

Boring Company dosahuje milníku v autonomním hloubení tunelů

Neura MiPa: První domácí robot dostupný k předobjednání

UGOKU Pad přináší ovládání chytrým telefonem pro gyroskopické zařízení Gen2

Úklidový robot od Loki Robotics se vypořádá s otravnými kancelářskými úkoly

Humanoidní robot PM01 od EngineAI debutuje za pouhých 13 700 $

Evropská strategie robotiky: Otevřená, ale ne naivní

Co mají společného AI a robotika v očích americké společnosti?