Roboti konečně zvládnou domácí práce? BEHAVIOR Challenge říká 'Dej mi pivo'

Po celá desetiletí byl slib domácího robota přesně tím – slibem. Předpokládalo se, že už budeme mít robotku Rosie, ale místo toho máme diskovité vysavače, které se zaseknou na rohožkách v koupelně. Propast mezi science fiction a naší domácí realitou je obrovská, poseta mrtvolami zkrachovalých startupů a přehnaně vychvalovaných dem. Nová soutěž, BEHAVIOR Challenge, která má debutovat na NeurIPS 2025, je však připravena vytáhnout obor, s velkým křikem a odporem, do reálného světa. Nebo alespoň do velmi, velmi přesvědčivé simulace.

Cíl výzvy je jednoduchý, avšak její provedení je brutální: přimět robota k plnění skutečných domácích prací. Nejen zvedání kostky, ale dokončování komplexních, vícekrokových činností, které lidé považují za všední. BEHAVIOR, což znamená Benchmark for Everyday Household Activities in Virtual, Interactive, and Realistic environments, není jen dalším robotickým benchmarkem; je to plnohodnotný domácí očistec navržený tak, aby dnešní špičkovou AI pořádně prověřil. A upřímně, už bylo na čase.

Vítejte v domácnosti z děsivého údolí

Jádrem BEHAVIOR Challenge je nesmírně sofistikované simulační prostředí, vedle kterého většina robotických pískovišť vypadá jako dětská ohrádka. Toto není sterilní laboratoř; je to vysoce věrný, fyzikální svět, kde se věci pořádně špiní. Benchmark je postaven na třech pilířích:

  • 1000 každodenních úkolů: Zapomeňte na skládání kostek. Mluvíme o úkolech jako „Sestavování dárkových košů“, „Uklízení talířů a jídla“ a existenciálně děsivé „Sklízení halloweenských dekorací“. Každý úkol je formálně definován v jazyce BEHAVIOR Domain Definition Language (BDDL), který specifikuje počáteční stav a přesné podmínky pro úspěch.
  • 50 interaktivních prostředí: Nejedná se jen o statické místnosti, ale o plně interaktivní rozvržení v měřítku domu, osídlených zhruba 10 000 manipulovatelnými objekty. Lednice se dá otevřít, rajče nakrájet a hadr se dá, no, prostě deformovat.
  • Simulátor OmniGibson: Postavený na platformě Omniverse od NVIDIA, je to místo, kde se odehrává to pravé kouzlo (a fyzika). OmniGibson podporuje nejen fyziku tuhých těles, ale také pokročilé jevy jako deformovatelné objekty, interakce s kapalinami a komplexní změny stavu, jako je ohřívání, chlazení a řezání. Právě to ho odlišuje od předchůdců a umožňuje úroveň realismu klíčovou pro trénování robotů, kteří se jednoho dne mohou ocitnout ve skutečné kuchyni.

Toto není jen test izolované manipulace nebo navigace. BEHAVIOR je první benchmark svého druhu, který vyžaduje, aby robot prováděl komplexní uvažování na vysoké úrovni, navigaci na dlouhé vzdálenosti a obratnou bimanipulaci, a to vše najednou. K úspěchu nestačí, aby AI byla dobrá v jedné věci; musí být dobrá v přemýšlení jako (velmi trpělivý) člověk.

Zkouška ohněm NeurIPS 2025

Pro svůj první běh na NeurIPS 2025 tato výzva vypouští 50 těchto plnohodnotných úkolů na globální výzkumnou komunitu. Soutěžící budou muset naprogramovat virtuálního robota, aby se vypořádal se scénáři, které mohou trvat několik minut, rozprostírat se přes více místností a zahrnovat desítky dílčích cílů. Představte si „Udělat pizzu“ nebo „Umýt hračky pro psa“ – úkoly, které vyžadují plánování, paměť a spoustu digitální dřiny.

Výchozím robotem pro tuto simulační zkoušku ohněm je Galaxea’s R1 Pro, kolový humanoid se dvěma 7-DOF rameny, 4-DOF trupem a sadou senzorů. Toto není žádná neohrabaná plechovka; jeho design je výslovně vybrán pro takový dosah, stabilitu a bimanipulační koordinaci, které jsou pro domácí aktivity nezbytné.

Aby účastníci nemuseli startovat svou AI od píky na zelené louce, organizátoři poskytují masivní datovou sadu: 10 000 expertních demonstrací, což je celkem přes 1200 hodin pečlivě zaznamenaných dat. Nejedná se o roztřesené, amatérské záběry. Jde o čistá, téměř optimální data shromážděná dodavatelem Simovation pomocí teleoperačního systému JoyLo. JoyLo, chytré nastavení využívající ruční ovladače na kinematických dvojitých ramenech, umožňuje lidským operátorům hladce vést robota úkoly a poskytuje dokonalou šablonu pro učení napodobováním.

Proč je to tak zatraceně těžké

Termín „dlouhý horizont“ se v AI často omílá, ale BEHAVIOR tomu dává grády. Úkol jako „Balení knih do úložného prostoru“ může vyžadovat, aby robot navigoval do obývacího pokoje, identifikoval správné knihy, našel krabici v garáži, přinesl ji zpět a poté postupně umístil každou knihu dovnitř. To testuje plánování a paměť po delší dobu způsobem, jakým to málokterý benchmark kdy dokázal.

Dále je ohromující čirá rozmanitost interakcí s objekty. Roboti musí rozumět a provádět dovednosti daleko za pouhé uchopení. Budou muset nalévat kapaliny, utírat povrchy, krájet zeleninu a přepínat vypínače. Objekty lze otevírat, zavírat, zahřívat, zmrazovat, čistit nebo dokonce zapálit. Tato bohatá sada požadovaných dovedností – nejméně 30 odlišných primitiv – nutí výzkumníky, aby se posunuli za modely pro jednotlivé úkoly směrem k obecnější