NVIDIA bouwt Matrix voor robots met Cosmos

Robots trainen voor de echte wereld is een tergend traag en gruwelijk inefficiënt proces. Voordat een bot je pantoffels kan halen, moet hij eerst leren niet van de trap te vallen, de kat niet te verwarren met een stofkonijn, of kortsluiting te krijgen in de regen. Deze leerschool is duur, tijdrovend en bol van het gevaar van kapotte hardware. NVIDIA, een bedrijf dat fortuin heeft gemaakt met het verkopen van de schoppen voor de AI-goudkoorts, heeft besloten dat de oplossing is om helemaal te stoppen met het trainen van robots in de echte wereld. In plaats daarvan bouwen ze een digitale dojo – een Matrix, als je wilt – om in te oefenen.

Maak kennis met NVIDIA Cosmos, een nieuw platform ontworpen om enorme hoeveelheden fysiek accurate, synthetische data te genereren om de volgende generatie ‘Fysieke AI’ te onderwijzen. Dit gaat niet alleen over het creëren van mooie simulaties; het gaat over het bouwen van fundamentele ‘wereldmodellen’ die een AI een intuïtief begrip geven van natuurkunde en causaliteit. Door robots miljoenen levens te laten ’leven’ in een virtueel rijk, kunnen ze duizend jaar training ervaren in slechts enkele dagen, lerend van elk denkbaar – en ondenkbaar – scenario zonder een krasje op hun echte-wereld lak.

Het evangelie van wereldmodellen

De kern van NVIDIA’s strategie is het ‘wereldmodel’, een concept dat AI wil verheffen van simpele patroonherkenning naar echt begrip. Een wereldmodel stelt een AI in staat om oorzaak en gevolg te simuleren, waardoor het in wezen een verbeeldingskracht krijgt. Het kan ‘wat als?’ vragen en de uitkomst van zijn acties voorspellen, een cruciale vaardigheid voor elke machine die door de chaotische, onvoorspelbare fysieke wereld navigeert.

De voordelen zijn pijnlijk duidelijk voor iedereen die een robot spectaculair heeft zien falen bij een simpele taak:

  • Veiligheid: Een beginnend autonoom voertuig kan tien miljoen keer crashen in een simulatie zonder gevolgen, lerend van elke blikschade om in de realiteit een veiligere bestuurder te worden.
  • Schaal: Het is onmogelijk om in de echte wereld data te verzamelen voor elk randgeval, zoals een hert met een verkeerskegel dat tijdens een hagelbui op de snelweg springt. Wereldmodellen kunnen deze bizarre-maar-mogelijke data op aanvraag genereren.
  • Efficiëntie: In plaats van elke actie moeizaam te programmeren, kunnen ontwikkelaars de AI laten leren via bekrachtiging in een gesimuleerde omgeving, waardoor de ontwikkeltijd en kosten drastisch worden verlaagd.

Dit is de basis van Fysieke AI – intelligentie die de wereld van atomen kan waarnemen, redeneren en ermee kan interacteren, niet alleen bits. En NVIDIA bouwt de kathedraal op die rots.

Omniverse: Het besturingssysteem voor de realiteit

Het podium voor dit grote robotische theater is NVIDIA Omniverse, een realtime 3D-ontwikkelplatform dat functioneert als een besturingssysteem voor het creëren van digitale tweelingen. Zie het als de fundamentele laag waar ontwikkelaars fotorealistische, fysiek accurate virtuele werelden kunnen bouwen en simuleren. Van een enkel magazijn tot een hele stad, Omniverse biedt de omgeving voor de AI om te trainen.

Een belangrijke pijler van Omniverse is de fundering op OpenUSD (Universal Scene Description), de 3D-scènebeschrijvingstechnologie die oorspronkelijk door Pixar is ontwikkeld. Dit is niet zomaar een bestandsformaat; het is een raamwerk voor interoperabiliteit, waardoor complexe 3D-data van verschillende tools naadloos kunnen samenleven en samenwerken. Deze open standaard voorkomt vendor lock-in en bevordert een samenwerkend ecosysteem, precies wat nodig is om werelden op schaal te bouwen. De Alliance for OpenUSD, met reuzen als Apple, Adobe en Autodesk naast NVIDIA, is een bewijs van het belang ervan voor de hele industrie.

Cosmos: De wereldsmid

Als Omniverse het podium is, dan is NVIDIA Cosmos de generatieve AI-engine die het script schrijft, de acteurs regisseert en het decor on-the-fly verandert. Gebouwd bovenop Omniverse, is Cosmos een platform gewapend met World Foundation Models (WFMs) – krachtige AI-modellen die specifiek getraind zijn om realistische werelddata te genereren en te manipuleren. Het is het systeem dat leven en oneindige variabiliteit in de digitale tweelingen blaast.

Cosmos biedt een reeks tools om de creatie van trainingsdata te automatiseren en op te schaal. Twee van de krachtigste componenten zijn Cosmos Predict en Cosmos Transfer.

Cosmos Predict & Cosmos Transfer

Cosmos Predict is het orakel van het platform. Je kunt het voorzien van een prompt – tekst, een afbeelding of een videoclip – en het zal een fysiek consistente video genereren van wat er vervolgens gebeurt. Een ontwikkelaar zou bijvoorbeeld een afbeelding van een straathoek kunnen invoeren en vragen om een 30-seconden simulatie te genereren van ’een bezorgwagen die door rood rijdt tijdens een sneeuwstorm’. Het model genereert de scène, compleet met accurate fysica, belichting en multi-camera perspectieven.

Cosmos Transfer, aan de andere kant, is een krachtpatser voor data-augmentatie. Het kan één enkele simulatie nemen en deze remixen tot duizenden variaties. Die ene video van een robot die door een magazijn navigeert, kan direct worden omgezet in scenario’s met verschillende belichting (dag, nacht, flikkerende TL-buizen), weersomstandigheden of oppervlaktetexturen. Dit proces creëert een robuuste dataset die de AI traint om een breed scala aan real-world omstandigheden aan te kunnen.

Meer dan alleen een simulatie

NVIDIA’s grootse visie is helder: het verkoopt niet langer alleen GPU’s. Het bouwt de hele verticaal geïntegreerde pijplijn voor het ontwikkelen, trainen en uitrollen van de volgende golf van fysieke AI. Door de hardware (GPU’s), de simulatieomgeving (Omniverse) en de generatieve AI voor datacreatie (Cosmos) te leveren, creëert NVIDIA een krachtig ecosysteem dat onmisbaar zou kunnen worden voor iedereen die robots of autonome systemen bouwt.

Deze zet pakt de grootste bottleneck in robotica aan: de acquisitie van hoogwaardige, diverse trainingsdata. Door data te veranderen in een grondstof die naar believen kan worden gegenereerd, verlaagt NVIDIA de drempel aanzienlijk en versnelt het de innovatie. De implicaties zijn enorm, en beloven de vooruitgang te versnellen in alles, van autonome logistiek en productie tot huishoudelijke robotica en daarbuiten. Het tijdperk van onhandige, voorgeprogrammeerde automaten loopt ten einde. Het tijdperk van de gesimuleerde, wereldwijze robot is net begonnen. En het lijkt erop dat ze zullen dromen van synthetische schapen, gegenereerd op een NVIDIA-chip.