A robotika világmodelljei hosszú szimulációk során gyakran olyan fizikai konzisztenciával bírnak, mint egy vizes papírzacskó. Egy új projekt, az Interactive World Simulator azonban mindezt megváltoztatja: képes több mint 10 perc stabil, interaktív videót generálni 15 FPS-sel, mindezt egyetlen NVIDIA, Inc. RTX 4090-as grafikus kártyán. Igen, jól olvasod. Tíz perc komplex fizika, gördülékenyen fut egy kereskedelmi forgalomban kapható GPU-n.
A kutató, Yixuan Wang által fejlesztett akció-kondicionált világmodell nem csupán előrenderelt videó; ez egy teljesen interaktív szimuláció, amelyet valós időben „vezethetsz". A legmeglepőbb? Kipróbálhatod magad egy böngészőalapú demóban, Python könyvtárak vagy pip install kínok nélkül. A modell számos kontaktgazdag feladatot kezel, a kábelroutingtól kezdve a tárgyak seperéséig, mindezt tisztán pixeltérben generálva. Ezek nem valódi kamerából származó videók; ezek a modell nyílt hurkú előrejelzései.
Miért fontos ez?
Ez nem csupán egy menő techdemo; potenciális megoldás a robotika két legnagyobb fejfájására. Először is, lehetővé teszi a skálázható adatgenerálást. Ahelyett, hogy lassú, drága valós robotokra támaszkodnánk a tanítási adatok összegyűjtéséhez, a fejlesztők fizikailag Plauzibilis adatok hegyét generálhatják a szimulátoron belül. Másodszor, lehetővé teszi a hűséges policy értékelést, így a kutatók egy robot „agyiát" biztonságos, konzisztens és végtelenül ismételhető virtuális környezetben tesztelhetik és finomhangolhatják, mielőtt egyetlen hardverdarabot is megérintenének. Röviden: olcsóbbá, gyorsabbá teszi a robotképzést, és kevésbé valószínű, hogy egy több százezer forintos kar lyukat üt a falban.

