NIST odhaluje nový benchmark pro humanoidní roboty

Americký National Institute of Standards and Technology (NIST) usoudil, že nastal čas zjistit, zda nejnovější generace nablýskaných humanoidů zvládne i něco jiného než jen zářit v dokonale sestříhaných marketingových videích. Agentura proto navrhla nový „Baseline Performance Benchmark“ – standardizovanou překážkovou dráhu navrženou k měření reálných schopností humanoidních robotů. Přichází tak téměř deset let poté, co stroje naposledy prošly drsnou a tehdy i poměrně pokořující zatěžkávací zkouškou v rámci DARPA Robotics Challenge (DRC).

Vzpomeňte si na roky 2013–2014. Tehdejší DRC nám sice přinesla nekonečnou studnici robotických „failů“ a pádů, ale zároveň nám uštědřila lekci v tom, jak neuvěřitelně těžké je pro stroj i tak banální úkon, jako je otevření dveří. NIST, který stál u zrodu tehdejších testů, nyní navrhuje jejich moderní ekvivalent. Cílem je vytvořit jednotnou sadu měřitelných úkolů, které by měl každý sebevědomý komerční humanoid zvládnout levou zadní. Navrhované testy se zaměřují na čtyři klíčové oblasti: mobilitu (schody, rampy), manipulaci (otáčení knoflíky, používání nářadí), loko-manipulaci (přenášení přepravky dveřmi) a kognici (plánování víceúrovňových úkolů).

Seznam úkolů pro navrhovaný benchmark humanoidních robotů NIST

NIST vyvíjí testovací metodiku a vybavení v úzké spolupráci s celým odvětvím a plánuje rozdat omezený počet fyzických testovacích sestav zdarma vybraným americkým výrobcům. Agentura aktivně vyzývá robotickou komunitu k připomínkování designu testů. V podstatě tak žádá firmy jako Boston Dynamics, Figure AI nebo Tesla, aby jí pomohly vyrobit přesně ten metr, kterým pak budou samy přeměřeny.

Proč je to tak důležité?

Robotický průmysl už roky ovládají pečlivě vymazlená demo videa, která ukazují bezchybný výkon v ideálních, laboratorních podmínkách. Dosud neexistoval žádný standardizovaný způsob, jak objektivně porovnat schopnosti robotů od různých výrobců. Zákazníkům i investorům tak nezbývalo než hádat, kdo disponuje skutečnou technologickou hloubkou a kdo má jen šikovného střihače videí. Benchmark od NIST by mohl do tohoto reklamního šumu konečně vnést jasné světlo.

Vytvořením sady opakovatelných a měřitelných úkolů NIST nastoluje rovná pravidla hry. Umožní to přímé srovnání „kus proti kusu“, které oddělí zrno od plev – tedy skutečně schopné stroje od laboratorních prototypů, které se bez dozoru inženýrů ani nehnou. Pro odvětví, které stojí na prahu masového komerčního nasazení, není tento druh objektivní validace jen užitečný, je naprosto nezbytný pro budování důvěry a smysluplný technologický pokrok. Další podrobnosti najdete v oficiálním návrhu.