1X's Nieuwe AI Voorspelt de Toekomst, Robots Oefenen in een Matrix

Vraag je je wel eens af hoe je een humanoïde robot van miljoenen euro’s leert om je kat niet voor een stofbal aan te zien? Of hoe het apparaat leert om een weerbarstige pot augurken te openen zonder de keukenkastdeur uit zijn scharnieren te trekken? Je zou een mensenleven kunnen besteden aan oefenen in de echte wereld, met een komische (en kostbare) bloopers-collectie als resultaat.

Of, als je robotbedrijf 1X bent, bouw je gewoon The Matrix voor je robots.

Vandaag onthulde 1X zijn 1X World Model (1XWM), een baanbrekende AI die fungeert als brug tussen de wereld van atomen en de wereld van bits. Het is een simulator met hoge betrouwbaarheid die de toekomst kan voorspellen, waardoor hun NEO-humanoïde robots kunnen oefenen, falen en leren in een digitale speeltuin voordat ze ooit een stap in je huis zetten.

Dit is niet zomaar een videogame-engine. Het is een glazen bol voor robotica, en het gaat een van de grootste knelpunten oplossen bij het creëren van werkelijk autonome androïden.

Het probleem: testen in de werkelijkheid is een pijnlijke zaak

Het ultieme doel voor 1X is om NEO-robots in te zetten in de meest chaotische omgeving die je kunt bedenken: onze huizen. Een plek waar autosleutels mysterieus teleporteren, meubilair naar willekeur wordt verplaatst, en dat ene specifieke Tupperware-deksel al sinds 2019 zoek is.

Het testen van de programmering (of “policy”) van een robot voor elk mogelijk scenario is fysiek onmogelijk. Je kunt niet een miljoen verschillende rommelige keukens nabootsen. Zoals 1X het stelt: “het fysiek evalueren van elke policy… zou meerdere mensenlevens kosten.”

1XWM: een digitale glazen bol voor robots

Het 1X World Model is het antwoord. Het neemt een startpunt uit de echte wereld—een paar videoframes van een kamer—en voorspelt vervolgens wat er zal gebeuren op basis van de specifieke acties van de robot.

En hier is het cruciale verschil met je typische “tekst-naar-video” AI: 1XWM is actie-bestuurbaar. Je geeft het geen vage opdracht zoals “maak het aanrecht schoon.” Je voert het exacte, low-level actietraject van de robot in—de precieze hoeken van zijn gewrichten, de snelheid van zijn arm, de kracht van zijn greep. Het model simuleert vervolgens de gevolgen, tot aan de natuurkunde van een doek die over een oppervlak veegt of een deur die op zijn scharnieren draait.

De resultaten zijn verbluffend. Het model kan meerdere, verschillende toekomstscenario’s genereren vanuit hetzelfde startpunt, en laten zien wat er gebeurt als NEO een mok pakt versus, bijvoorbeeld, luchtgitaar speelt. Dit stelt 1X in staat om miljoenen experimenten uit te voeren in een fractie van de tijd, en hun AI te stresstesten zonder dat er in de echte wereld ook maar één object wordt verplaatst.

De Matrix ontcijferen: een snelle gids

Voel je je alsof je net de rode pil hebt genomen? Laten we de belangrijkste termen uitleggen.

Wat is een “World Model”? Zie het als de interne verbeelding van een AI. Het is een simulatie van hoe de wereld werkt, waardoor de AI kan voorspellen “wat er vervolgens gebeurt” als het een bepaalde actie uitvoert. Het is het verschil tussen leren door vallen en opstaan en eerst de gevolgen doordenken.

Wat is een “Robot Policy”? In eenvoudige termen is het de hersenen of besluitvormingsstrategie van de robot. Het is de complexe set regels die de robot vertelt welke actie te nemen op basis van wat hij ziet, hoort en voelt. Het World Model wordt gebruikt om snel te evalueren welke “policy” het beste is.

Wat betekent “Actie-bestuurbaar”? Het betekent dat de simulatie wordt gestuurd door de exacte, precieze bewegingen van de robot, niet door een algemeen tekstcommando. Dit is essentieel voor het realistisch simuleren van natuurkunde. Het model moet weten of de robot probeert een deur te duwen of te trekken.

Wat is “Proprioceptie”? Het is het gevoel van de robot voor zijn eigen lichaam. Hij weet waar zijn ledematen zijn, hoe zijn gewrichten gebogen zijn, en hoe hij zich door de ruimte beweegt zonder zichzelf te hoeven “zien”. Het is ons menselijke gevoel voor aanraking en evenwicht, maar dan voor een robot. 1X ontdekte dat policies die proprioceptie gebruiken aanzienlijk beter presteren.

Wat zijn “Counterfactuals”? Dit zijn “wat-als” scenario’s. Het World Model kan een situatie nemen waarin een robot faalde in de echte wereld en simuleren wat er zou zijn gebeurd als hij een andere actie had ondernomen. Het is als een tijdmachine voor robottraining.

Van virtuele praktijk naar realistische slimheid

Dus, zorgt al dit digitale dagdromen daadwerkelijk voor een betere robot? Volgens 1X is het antwoord een overtuigend ja.

Er is een hoge correlatie tussen de voorspellingen van het World Model en de resultaten in de echte wereld. Wanneer de simulator voorspelde dat één versie van de AI beter zou zijn in een taak dan een andere, bewezen evaluaties in de echte wereld dat dit klopte. Deze directe feedbacklus is revolutionair en stelt hen in staat om:

  • De beste hersenen te selecteren: Snel het best presterende AI-model uit een trainingsrun te kiezen, zonder langdurige fysieke tests.
  • Te leren van fouten: Datasets samen te stellen van mislukkingen in de echte wereld en het model te gebruiken om te onderzoeken wat de robot anders had moeten doen.
  • Leren op te schalen: Hoe meer data het model ziet, hoe slimmer het wordt. Het kan zelfs kennis overdragen van de ene taak naar de andere—beter worden in het hanteren van een plank helpt het om een arcademachine te begrijpen.

Natuurlijk is het niet perfect. 1X is transparant over de beperkingen. Het model heeft momenteel moeite met het simuleren van interacties met objecten die het nog nooit heeft gezien. Maar naarmate het volume aan trainingsdata groeit, wordt verwacht dat deze “verbeeldingskloof” zal krimpen.

De toekomst is synthetisch

Het einddoel voor 1X is monumentaal. Ze geloven dat een voldoende geavanceerd World Model synthetische data kan genereren die niet te onderscheiden is van data uit de echte wereld.

Wanneer dat gebeurt, zou het dataknelpunt dat de robotica decennialang heeft geplaagd, kunnen verdwijnen. Je hoeft niet meer jaren te besteden aan het verzamelen van gegevens; je kunt onbeperkte, perfect op maat gemaakte trainingsscenario’s genereren binnen het model.

Zoals het team van 1X stelt: “Data en evaluaties zijn de hoeksteen van het oplossen van autonomie, en 1XWM biedt een geïntegreerd pad om beide uitdagingen aan te pakken.”

Het is een gedurfde visie: een toekomst waarin androïden niet alleen in de echte wereld worden getraind, maar in een digitale wereld van henzelf—een Matrix die hen voorbereidt op de onze. En zoals altijd zal RoboHorizon Magazine hier zijn om te rapporteren hoe die gesimuleerde toekomst onze realiteit wordt.