Ve vývoji, který by měl švédské designéry nábytku pořádně znervóznět, výzkumníci odhalili RoboHorizon, nový AI framework, který výrazně zvyšuje schopnost robota provádět komplexní, vícekrokové úkoly. Systém chytře využívá velký jazykový model (LLM), který funguje jako jakýsi projektový manažer, rozkládá vágní instrukce na řadu splnitelných dílčích úkolů a generuje hustou strukturu odměn, aby robot zůstal na správné cestě. Tento nový proces Recognize-Sense-Plan-Act (RSPA) vedl k dramatickému zlepšení úspěšnosti o 29,23 % u úkolů s dlouhým horizontem.
Jádrem problému v robotice s dlouhým horizontem je, že úkoly často poskytují řídké odměny; robot se o úspěchu dozví až po tuctu složitých kroků, což ztěžuje učení, které konkrétní akce byly správné. RoboHorizon to řeší tím, že LLM vytvoří podrobný kontrolní seznam s odměnami za každý krok. To je spárováno s metodou “detekce klíčových snímků”, která pomáhá robotovi zaměřit jeho vizuální systém na nejdůležitější okamžiky úkolu, jako je okamžik, kdy chapadlo naváže kontakt s objektem. Je to robotická obdoba toho, když se nenecháte rozptylovat a skutečně si přečtete návod.

Nikde to nebylo zřetelnější než na benchmarku FurnitureBench, sérii úkolů inspirovaných IKEA, navržených tak, aby byly pro autonomní systémy jedinečně frustrující. Tento test vyžaduje dlouhodobé plánování, přesnou manipulaci a schopnost správně spojit různé díly – výzvy, které brzdí mnoho současných modelů. Úspěch RoboHorizon v této oblasti demonstruje významný krok směrem k robotům, kteří dokážou zvládnout komplexní montáž v reálném světě, která byla až dosud výhradní a bolestnou doménou lidí.

Proč je to důležité?
Tento výzkum řeší zásadní překážku ve vytváření skutečně užitečných, univerzálních robotů. Integrací abstraktních plánovacích schopností LLM s fyzickou exekucí robotického modelu světa poskytuje RoboHorizon plán pro stroje, které dokážou spolehlivě dokončovat složité úkoly. Namísto omezení na jednotlivé, opakující se akce otevírá tento přístup dveře robotům, kteří dokáží plánovat, adaptovat se a provádět vícestupňové práce v továrnách, laboratořích nebo dokonce domácnostech, čímž se sen o kompetentním robotickém asistentovi přibližuje realitě o jeden gigantický skok.