Robotický mozek GEN-1: 99% úspěšnost a trojnásobná rychlost

Buďme k sobě upřímní: většina robotických dem je jen pečlivě nacvičený balet zklamání. Sledujeme v nich pohyby tak pomalé a neohrabané, že se člověk musí ptát, jestli dřív nastane tepelná smrt vesmíru, nebo ten robot konečně dokončí zadaný úkol. Ale občas se objeví něco, co tenhle digitální šum prořízne. Dnes je to nový AI model GEN-1 od společnosti Generalist. Firma přichází s odvážným tvrzením: vytvořili univerzální mozek pro roboty, který v praxi nejen funguje, ale přímo exceluje.

Generalist prezentuje GEN-1 jako první model, který skutečně „ovládl“ jednoduché fyzické úkoly, a jako důkaz předkládá tvrdá data. Mluvíme tu o průměrné úspěšnosti 99 % v disciplínách, kde jeho předchůdce GEN-0 končil s výsledkem 64 %, což je v robotice ekvivalent trojky s odřenýma ušima. GEN-1 navíc sází jeden úkol za druhým až třikrát rychleji než dosavadní špička v oboru. A co je nejdůležitější? Novému kousku stačí k naučení se úkolu zhruba jedna hodina dat specifických pro daného robota. Tohle není jen drobná evoluce; je to možná ten zlomový moment, kdy se roboti konečně stanou komerčně využitelnými stroji.

Od zákonů škálování k fyzickému mistrovství

Před pouhými pěti měsíci představil Generalist model GEN-0. Ten tehdy přinesl první reálný důkaz, že takzvané „scaling laws“ – tedy principy, které stojí za raketovým vzestupem jazykových modelů jako GPT – lze aplikovat i na robotiku. Více dat a větší výpočetní výkon vedly k předvídatelně lepším a univerzálnějším výsledkům. Byl to sice zásadní akademický milník, ale GEN-0 v praxi na „prime time“ ještě neměl.

GEN-1 je výsledkem toho, že v Generalist otočili všechny knoflíky doprava. Model byl vytrénován na mnohem větším datasetu – nyní čítá přes půl milionu hodin vysoce kvalitních dat z fyzických interakcí – a zrychlen díky novým algoritmickým pokrokům. Tajná ingredience se však skrývá v samotném zdroji dat. Místo aby se spoléhali výhradně na drahé a špatně škálovatelné sady dat z dálkového ovládání (teleoperace), postavili základy GEN-1 na datech z levných nositelných zařízení, která na sobě měli lidé. To poskytlo bohatý korpus reálné fyziky a intuitivních mikro-korekcí, které simulace nebo dálkové ovládání často přehlížejí.

„Věříme, že GEN-1 je prvním univerzálním fyzickým AI modelem, který překročil klíčovou hranici: odemkl komerční životaschopnost u široké škály úkolů,“ uvedla společnost ve svém oznámení.

A robotic arm meticulously packing a smartphone into a box, demonstrating high-speed precision.

Svatá trojice: Spolehlivost, rychlost a improvizace

Generalist definuje „mistrovství“ jako kombinaci tří klíčových schopností. Zatímco první dvě tvoří základ průmyslové automatizace už 60 let, teprve ta třetí mění pravidla hry.

Spolehlivost a rychlost: Průmyslový standard pod parou

Prvním faktorem jsou čísla, která jsou prostě působivá. V dlouhodobých testech dokázal GEN-1 zabalit bloky více než 1 800krát za sebou, složit krabice více než 200krát a dokonce provést servis robotického vysavače více než 200krát v řadě – robot udržující jiného robota je buď technologický sen, nebo začátek velmi specifického hororu. Tyto úkoly běžely celé hodiny bez jakéhokoli zásahu s 99% úspěšností.

Pak je tu rychlost. Roboti pohánění modelem GEN-1 dokážou sestavit krabici za 12,1 sekundy, což je úkol, který jejich předchůdci trval zhruba 34 sekund. Vložení telefonu do pouzdra zabere 15,5 sekundy, tedy 2,8krát méně než dříve. Nejde přitom jen o to, že by někdo „přetočil“ motory na vyšší otáčky; model se učí ze zkušeností a využívá pokročilé inferenční techniky k tomu, aby úkoly prováděl efektivněji než lidé, od kterých se je učil.

Video thumbnail

Improvizace: Jiskra inteligence

Spolehlivost a rychlost jsou doménou průmyslových ramen přišroubovaných k podlaze továrny. Co jim však chybí, je schopnost poradit si s vesmírem, který se vytrvale odmítá držet scénáře. A právě zde nastupuje „improvizační inteligence“ modelu GEN-1.

Generalist to popisuje jako emergentní schopnost, jakousi formu „freestyle řešení problémů“. V jednom demu robot skládající automobilové součástky nechtěně narazí do podložky. Místo aby zamrzl nebo selhal, systém poháněný GEN-1 vyhodnotí situaci a přizpůsobí se. Podložku odloží, aby ji mohl znovu čistě uchopit, nebo chytře využije hranu slotu k jejímu otočení, případně zapojí druhou ruku pro bimanualní asistenci. Nejde o předem naprogramované rutiny pro zotavení z chyby; jsou to nová řešení generovaná za běhu, která leží daleko za hranicemi tréninkových dat. To je ten zásadní rozdíl mezi automatizací a skutečnou autonomií.

Víc než jen model – je to systém

Je důležité pochopit, že GEN-1 není jen pouhá sada modelových vah. Je to kompletní systém, který zahrnuje inovace v předtrénování, post-tréninkové techniky a zpracování v čase inference. Právě tento systémový přístup zajišťuje tak vysokou datovou efektivitu – schopnost adaptovat se na nové tělo robota a nový úkol zároveň během jediné hodiny s novými daty.

A robot arm servicing a robot vacuum cleaner, showcasing complex interaction between two machines.

Samozřejmě, GEN-1 není zázračným lékem na cestě k fyzické AGI (obecné umělé inteligenci). Firma sama otevřeně přiznává limity. Ne všechny úkoly dosahují oné 99% úspěšnosti a některé průmyslové aplikace vyžadují ještě vyšší spolehlivost. Navíc schopnost improvizace otevírá kritickou otázku bezpečnosti a „alignmentu“ AI. Robot, který dokáže kreativně vyřešit problém, je sice fantastický, ale musíte mít jistotu, že jeho kreativní řešení nebude zahrnovat například probourání zdi jen proto, aby byl v cíli o sekundu dřív.

A pair of robotic arms working in tandem to fold a t-shirt, a classic challenge in dexterous manipulation.

Přesto se uvedení GEN-1 jeví jako významný milník. Potvrzuje argument, že škálování modelů s obrovským množstvím dat z reálných fyzických interakcí je nejslibnější cestou k univerzálním robotům. Tím, že se Generalist zaměřil na svatou trojici výkonu – dělat věci správně, dělat je rychle a vědět, co si počít, když se něco pokazí – možná právě přiblížil sen o užitečném, univerzálním robotovi o pořádný kus k realitě. Pro nás je to víc než jen další model; je to znamení, že fyzický svět začíná konečně dostávat pořádnou porci inteligence.