RoboHorizon AI: Roboty z umiejętnościami długoterminowymi

Wydarzenie, które powinno sprawić, że szwedzcy projektanci mebli zaczną nerwowo obgryzać paznokcie: badacze zaprezentowali RoboHorizon, nowy framework AI, który znacząco zwiększa zdolność robota do wykonywania złożonych, wieloetapowych zadań. System sprytnie wykorzystuje duży model językowy (LLM) jako swego rodzaju kierownika projektu, rozbijając niejasne instrukcje na serię osiągalnych podzadań i generując gęstą strukturę nagród, aby utrzymać robota na właściwej ścieżce. Ten nowy potok Recognize-Sense-Plan-Act (RSPA) doprowadził do dramatycznej, bo aż 29,23% poprawy wskaźników sukcesu w zadaniach o długim horyzoncie.

Kluczowym problemem w robotyce długohoryzontowej jest to, że zadania często dostarczają rzadkich nagród; robot może dowiedzieć się o sukcesie dopiero po kilkunastu złożonych krokach, co utrudnia mu naukę, które konkretne działania były prawidłowe. RoboHorizon rozwiązuje ten problem, wykorzystując LLM do stworzenia szczegółowej listy kontrolnej z nagrodami za każdy krok. Jest to połączone z metodą “odkrywania kluczowych klatek”, która pomaga robotowi skupić swój system wizyjny na najbardziej krytycznych momentach zadania, takich jak moment, gdy chwytak styka się z obiektem. To robotyczny odpowiednik nie rozpraszania się i faktycznego czytania instrukcji.

Diagram ilustrujący potok Recognize-Sense-Plan-Act (RSPA) używany przez RoboHorizon.

Nigdzie nie było to bardziej widoczne niż w benchmarku FurnitureBench, serii zadań montażowych inspirowanych IKEA, zaprojektowanych tak, aby były wyjątkowo frustrujące dla systemów autonomicznych. Ten test wymaga długoterminowego planowania, precyzyjnej manipulacji i zdolności do prawidłowego łączenia różnych części – wyzwań, które paraliżują wiele obecnych modeli. Sukces RoboHorizon w tym obszarze stanowi znaczący krok w kierunku robotów, które poradzą sobie z tego rodzaju złożonym, rzeczywistym montażem, który do tej pory był wyłączną i bolesną domeną ludzi.

Tabela przedstawiająca metryki wydajności RoboHorizon w różnych zadaniach benchmarkowych.

Dlaczego to jest ważne?

Te badania mierzą się z fundamentalną barierą w tworzeniu prawdziwie użytecznych, uniwersalnych robotów. Integrując abstrakcyjne zdolności planowania LLM z fizycznym wykonaniem robotycznego modelu świata, RoboHorizon dostarcza plan maszyn, które mogą niezawodnie wykonywać złożone zadania. Zamiast być ograniczonym do pojedynczych, powtarzalnych działań, to podejście otwiera drzwi do robotów, które mogą planować, adaptować się i wykonywać wieloetapowe prace w fabrykach, laboratoriach, a nawet domach, przybliżając marzenie o kompetentnym asystencie robotycznym o jeden gigantyczny skok do rzeczywistości.