In een ontwikkeling die Zweedse meubelontwerpers het angstzweet moet bezorgen, hebben onderzoekers RoboHorizon onthuld, een nieuw AI-framework dat het vermogen van een robot om complexe, meerstaps taken uit te voeren aanzienlijk verhoogt. Het systeem maakt slim gebruik van een Large Language Model (LLM) om als een soort projectmanager te fungeren, vage instructies op te splitsen in een reeks haalbare subtaken en een dichte beloningsstructuur te genereren om de robot op koers te houden. Deze nieuwe Recognize-Sense-Plan-Act (RSPA) pijplijn leidde tot een dramatische verbetering van 29,23% in succespercentages bij taken met een lange horizon.
Het kernprobleem in ’long-horizon’ robotica is dat taken vaak ‘sparse rewards’ opleveren; een robot weet pas na een dozijn complexe stappen of hij succesvol was, wat het moeilijk maakt om te leren welke specifieke acties correct waren. RoboHorizon pakt dit aan door een LLM een gedetailleerde checklist met beloningen voor elke stap te laten maken. Dit wordt gekoppeld aan een “keyframe discovery”-methode die de robot helpt zijn visuele systeem te richten op de meest kritieke momenten van een taak, zoals het moment dat een grijper contact maakt met een object. Het is het robotische equivalent van niet afgeleid worden en daadwerkelijk de instructies lezen.

Nergens was dit duidelijker dan bij de FurnitureBench benchmark, een reeks op IKEA geïnspireerde montagetaken die speciaal zijn ontworpen om autonome systemen uniek frustrerend te vinden. Deze test vereist langetermijnplanning, precieze manipulatie en het vermogen om verschillende onderdelen correct met elkaar te verbinden – uitdagingen die veel huidige modellen dwarsbomen. Het succes van RoboHorizon hier toont een belangrijke stap naar robots die de soort complexe, real-world assemblage aankunnen die tot nu toe het exclusieve en pijnlijke domein van mensen was.

Waarom is dit belangrijk?
Dit onderzoek tackelt een fundamentele barrière voor het creëren van werkelijk nuttige, algemeen inzetbare robots. Door de abstracte planningsmogelijkheden van LLM’s te integreren met de fysieke uitvoering van een robotisch wereldmodel, biedt RoboHorizon een blauwdruk voor machines die betrouwbaar complexe klusjes kunnen uitvoeren. In plaats van beperkt te zijn tot enkele, repetitieve acties, opent deze aanpak de deur naar robots die meerfasige taken kunnen plannen, aanpassen en uitvoeren in fabrieken, laboratoria of zelfs huizen, waardoor de droom van een competente robotassistent een gigantische stap dichterbij de realiteit komt.