1X představuje novou AI, která předpovídá budoucnost a umožňuje robotům trénovat v Matrixu

Jak naučit robota za miliony dolarů nezmátnout vaši kočku s prachovým králíkem? 1X představuje svůj Matrix pro roboty

Přemýšleli jste někdy, jak naučit humanoidního robota za miliony dolarů, aby nezaměnil vaši kočku za prašného králíka? Nebo jak ho naučit otevřít vzpurnou sklenici s okurkami, aniž by vytrhl dvířka skříňky z pantů? Mohli byste strávit celý život tím, že mu necháte trénovat v reálném světě a nasbíráte komickou (a drahou) sbírku přešlapů.

Nebo, pokud jste robotická společnost 1X, jednoduše vybudujete pro své roboty Matrix.

Dnes společnost 1X odhalila svůj 1X World Model (1XWM), průlomovou umělou inteligenci, která slouží jako most mezi světem atomů a světem bitů. Jde o vysoce věrný simulátor, který dokáže předpovídat budoucnost a umožňuje jejich humanoidním robotům NEO cvičit, selhávat a učit se v digitálním prostředí ještě předtím, než udělají první krok ve vašem domově.

Nejde jen o další herní engine. Je to věštecká koule pro robotiku, která má vyřešit jednu z největších překážek při vytváření skutečně autonomních androidů.

Problém: Testování v realitě je bolestivé

Konečným cílem společnosti 1X je nasadit roboty NEO do nejchaotičtějšího prostředí, jaké si lze představit: našich domovů. Do místa, kde se klíče od auta záhadně teleportují, nábytek se přesouvá podle rozmaru a konkrétní víčko od krabičky na jídlo se pohřešuje od roku 2019.

Testování robotického programování (neboli “policy”) pro každý možný scénář je fyzicky nemožné. Nemůžete vytvořit milion různých zaházených kuchyní. Jak uvádí 1X, “fyzické vyhodnocení každé policy… by trvalo několik lidských životů.”

1XWM: Digitální věštecká koule pro roboty

1X World Model je odpovědí. Vezme reálný výchozí bod – několik video snímků místnosti – a poté předpoví, co se stane dále na základě konkrétních akcí robota.

A zde je zásadní rozdíl od typického AI modelu “text-to-video”: 1XWM je akčně ovladatelný. Nedáváte mu vágní pokyn jako “vyčisti pult”. Zadáte mu přesnou trajektorii akce robota na nízké úrovni – přesné úhly jeho kloubů, rychlost jeho paže, sílu úchopu. Model pak simuluje důsledky, včetně fyziky utírání povrchu hadříkem nebo dveří pohybujících se na pantech.

Výsledky jsou ohromující. Model dokáže generovat několik odlišných budoucností ze stejného výchozího bodu a ukazuje, co se stane, když NEO uchopí hrnek, nebo třeba hraje na imaginární kytaru. To umožňuje společnosti 1X provádět miliony experimentů ve zlomku času a testovat svou AI bez jediného pohnutého předmětu v reálném světě.

Průvodce Matrixem: Vysvětlení pojmů

Cítíte se, jako byste právě spolkli červenou pilulku? Pojďme si vysvětlit klíčové pojmy.

Co je “World Model”? Představte si ho jako vnitřní představivost AI. Je to simulace fungování světa, která umožňuje AI předvídat “co se stane dál”, pokud provede určitou akci. Je to rozdíl mezi učením metodou pokus-omyl a promýšlením důsledků předem.

Co je “Robot Policy”? Jednoduše řečeno, je to robotův mozek nebo strategie rozhodování. Je to komplexní soubor pravidel, který robotovi říká, jakou akci má provést na základě toho, co vidí, slyší a cítí. World Model se používá k rychlému vyhodnocení, která “policy” je nejlepší.

Co znamená “Action-Controllable”? Znamená to, že simulace je řízena přesnými pohyby robota, nikoli obecným textovým příkazem. To je zásadní pro realistickou simulaci fyziky. Model musí vědět, zda se robot snaží dveře tlačit nebo táhnout.

Co je “Propriocepce”? Je to robotův smysl pro vlastní tělo. Ví, kde jsou jeho končetiny, jak jsou úhly jeho kloubů, a jak se pohybuje prostorem, aniž by se musel “vidět”. Je to náš lidský smysl pro dotyk a rovnováhu, ale pro robota. 1X zjistil, že policy využívající propriocepci fungují výrazně lépe.

Co jsou “Kontrafaktuály”? Jsou to scénáře “co kdyby”. World Model může vzít situaci, kdy robot selhal v reálném světě, a simulovat, co by se stalo, kdyby provedl jinou akci. Je to jako mít stroj času pro trénink robotů.

Od virtuální praxe k reálné inteligenci

Takže, dělá všechno to digitální snění skutečně lepšího robota? Podle 1X je odpověď jednoznačně ano.

Existuje vysoká korelace mezi předpověďmi World Modelu a výsledky v reálném světě. Když simulátor předpověděl, že jedna verze AI bude v úkolu lepší než jiná, reálné hodnocení to potvrdilo. Tato okamžitá zpětnovazební smyčka je revoluční a umožňuje:

  • Vybrat nejlepší mozky: Rychle vybrat nejlépe fungující AI model z trénovacího běhu bez dlouhých fyzických testů.
  • Učit se z chyb: Kurátorovat datasety reálných selhání a použít model k prozkoumání toho, co měl robot udělat jinak.
  • Škálovat učení: Čím více dat model vidí, tím je chytřejší. Dokonce může přenášet znalosti z jednoho úkolu na druhý – zlepšení v manipulaci s policí mu pomáhá porozumět arkádovému automatu.

Samozřejmě, není dokonalý. 1X je ohledně svých omezení transparentní. Model v současnosti bojuje se simulací interakcí s objekty, které nikdy předtím neviděl. Ale s rostoucím objemem tréninkových dat se očekává, že tato “mezera v představivosti” se zmenší.

Budoucnost je syntetická

Konečný cíl společnosti 1X je monumentální. Věří, že dostatečně pokročilý World Model by mohl generovat syntetická data, která budou k nerozeznání od dat z reálného světa.

Když k tomu dojde, datové úzké hrdlo, které sužovalo robotiku po desetiletí, by mohlo zmizet. Už nebudete muset trávit roky sběrem dat; můžete generovat neomezené, dokonale přizpůsobené tréninkové scénáře uvnitř modelu.

Jak uvádí tým 1X, “Data a vyhodnocení jsou základním kamenem řešení autonomie a 1XWM poskytuje jednotnou cestu k řešení obou výzev.”

Je to odvážná vize: budoucnost, kde androidi jsou trénováni nejen v reálném světě, ale i v digitálním – Matrix, který je připravuje na ten náš. A jako vždy, časopis RoboHorizon bude zde, aby informoval o tom, jak se tato simulovaná budoucnost stává naší realitou.