Ako naučiť humanoidného robota, aby nezamenil vašu mačku za prach? Vytvorte preň Matrix
Premýšľali ste niekedy, ako naučiť humanoidného robota za milióny dolárov, aby si nepomýlil vašu mačku s chuchvalcom prachu? Alebo ako ho naučiť otvoriť zaschnutú zaváraninu bez toho, aby vytrhol dvierka skrinky z pántov? Mohli by ste stráviť celý život tým, že ho necháte cvičiť v reálnom svete, pričom by ste nazbierali komickú (a drahú) zbierku prešľapov.
Alebo, ak ste robotická spoločnosť 1X, jednoducho pre svojich robotov vytvoríte Matrix.
Dnes spoločnosť 1X predstavila svoj 1X World Model (1XWM), prelomovú umelú inteligenciu, ktorá slúži ako most medzi svetom atómov a svetom bitov. Je to simulátor s vysokou vernosťou, ktorý dokáže predpovedať budúcnosť a umožňuje ich humanoidným robotom NEO cvičiť, zlyhávať a učiť sa v digitálnom prostredí ešte predtým, než spravia prvý krok vo vašej domácnosti.
Nejde len o ďalší herný engine. Je to veštecká guľa pre robotiku, ktorá má vyriešiť jednu z najväčších prekážok pri vytváraní skutočne autonómnych androidov.
Problém: Testovanie v realite je utrpenie
Konečným cieľom spoločnosti 1X je nasadiť robotov NEO do najchaotickejšieho prostredia, aké si viete predstaviť: do našich domovov. Miesta, kde sa kľúče od auta záhadne teleportujú, nábytok sa presúva podľa rozmarov a to jedno špecifické veko od dózy sa stratilo už v roku 2019.
Testovanie programovania robota (alebo “politiky”) pre každý možný scenár je fyzicky nemožné. Nemôžete vytvoriť milión rôznych preplnených kuchýň. Ako hovorí 1X, “fyzické vyhodnotenie každej politiky… by trvalo niekoľko životov.”
1XWM: Digitálna veštecká guľa pre robotov
1X World Model je odpoveďou. Vezme reálny východiskový bod – niekoľko videozáberov miestnosti – a potom predpovedá, čo sa stane ďalej na základe konkrétnych akcií robota.
A tu je zásadný rozdiel oproti typickej AI “text-na-video”: 1XWM je ovládateľný akciami. Nedávate mu vágny pokyn ako “vyčisti pult”. Zadáte mu presnú, nízkoúrovňovú trajektóriu akcie robota – presné uhly jeho kĺbov, rýchlosť jeho ramena, silu jeho úchopu. Model potom simuluje dôsledky, až po fyziku utierania povrchu handričkou alebo otáčanie dverí na pántoch.
Výsledky sú ohromujúce. Model dokáže generovať viacero odlišných budúcností z rovnakého východiskového bodu, pričom ukazuje, čo sa stane, ak NEO uchopí hrnček, alebo, povedzme, zahrá na imaginárnu gitaru. To umožňuje spoločnosti 1X vykonať milióny experimentov za zlomok času, testovať ich AI bez toho, aby sa v reálnom svete čokoľvek pohlo.
Odborný slovníček Matrix: Rýchly sprievodca
Cítite sa, akoby ste práve prehltli červenú pilulku? Vysvetlime si kľúčové pojmy.
Čo je “World Model”? Predstavte si ho ako vnútornú predstavivosť AI. Je to simulácia toho, ako funguje svet, ktorá umožňuje AI predpovedať “čo sa stane ďalej”, ak vykoná určitú akciu. Je to rozdiel medzi učením sa metódou pokus-omyl a premýšľaním o dôsledkoch vopred.
Čo je “Robot Policy”? Jednoducho povedané, je to mozog robota alebo jeho stratégia rozhodovania. Je to komplexný súbor pravidiel, ktorý robotovi hovorí, akú akciu má vykonať na základe toho, čo vidí, počuje a cíti. World Model sa používa na rýchle vyhodnotenie, ktorá “politika” je najlepšia.
Čo znamená “Action-Controllable”? Znamená to, že simulácia je riadená presnými, konkrétnymi pohybmi robota, nie všeobecným textovým príkazom. To je nevyhnutné pre realistickú simuláciu fyziky. Model musí vedieť, či sa robot snaží dvere tlačiť alebo ťahať.
Čo je “Propriocepcia”? Je to zmysel robota pre vlastné telo. Vie, kde má končatiny, v akom uhle sú jeho kĺby a ako sa pohybuje v priestore bez toho, aby sa musel “vidieť”. Je to náš ľudský zmysel pre dotyk a rovnováhu, ale pre robota. 1X zistil, že politiky využívajúce propriocepciu fungujú výrazne lepšie.
Čo sú “Protifaktuály”? Sú to scenáre “čo-keby”. World Model môže vziať situáciu, v ktorej robot v reálnom svete zlyhal, a simulovať, čo by sa stalo, keby vykonal inú akciu. Je to ako mať stroj času pre tréning robotov.
Od virtuálnej praxe k reálnej inteligencii
Takže, robí všetko toto digitálne snívanie skutočne lepšieho robota? Podľa 1X je odpoveď jednoznačne áno.
Existuje vysoká korelácia medzi predpoveďami World Modelu a výsledkami v reálnom svete. Keď simulátor predpovedal, že jedna verzia AI bude lepšia v úlohe než iná, hodnotenia v reálnom svete to potvrdili. Táto okamžitá spätná väzba je revolučná a umožňuje:
- Vybrať najlepšie mozgy: Rýchlo vybrať najlepšie fungujúci AI model z tréningového behu bez zdĺhavých fyzických testov.
- Učiť sa z chýb: Zostavovať datasety reálnych zlyhaní a použiť model na skúmanie toho, čo mal robot urobiť inak.
- Škálovať učenie: Čím viac dát model vidí, tým je inteligentnejší. Dokáže dokonca prenášať znalosti z jednej úlohy na inú – zlepšenie v manipulácii s policou mu pomáha pochopiť arkádový automat.
Samozrejme, nie je dokonalý. 1X je transparentný ohľadom jeho obmedzení. Model v súčasnosti zápasí so simuláciou interakcií s objektmi, ktoré nikdy predtým nevidel. Ale s rastúcim objemom tréningových dát sa očakáva, že táto “medzera v predstavivosti” sa zmenší.
Budúcnosť je syntetická
Konečný cieľ pre 1X je monumentálny. Veria, že dostatočne pokročilý World Model by mohol generovať syntetické údaje, ktoré sú nerozlíšiteľné od údajov z reálneho sveta.
Keď sa to stane, problém s nedostatkom dát, ktorý trápi robotiku už desaťročia, by mohol zmiznúť. Už nebudete musieť stráviť roky zbieraním dát; môžete generovať nekonečné, dokonale prispôsobené tréningové scenáre vo vnútri modelu.
Ako uvádza tím 1X, “Dáta a hodnotenia sú základným kameňom riešenia autonómie a 1XWM poskytuje jednotnú cestu na riešenie oboch výziev.”
Je to odvážna vízia: budúcnosť, kde sa androidy trénujú nielen v reálnom svete, ale aj v digitálnom – v Matrixe, ktorý ich pripravuje na ten náš. A ako vždy, časopis RoboHorizon bude tu, aby informoval o tom, ako sa táto simulovaná budúcnosť stáva našou realitou.