Rhoda AI: 450 milionů dolarů pro roboty, kteří se učí z videí

Jasným důkazem, že AI horečka ani zdaleka nepolevuje, je velkolepý nástup robotického startupu Rhoda AI. Ten po osmnácti měsících v utajeném režimu (tzv. stealth mode) doslova vtrhl na scénu a oznámil obří investiční kolo Series A ve výši 450 milionů dolarů. Investice vedená fondem Premji Invest katapultovala tuto firmu z Palo Alta k valuaci 1,7 miliardy dolarů a oficiálně odhalila ambiciózní plán: dát průmyslovým robotům mozek vytrénovaný na videích z internetu.

Platforma společnosti Rhoda AI, pojmenovaná FutureVision, si klade za cíl vyřešit letitý problém robotiky – jak vytvořit stroje, které se dokážou adaptovat na nepředvídatelný reálný svět, místo aby byly omezeny na rigidně naprogramované úkony. „Tajemstvím šéfkuchaře“ je v tomto případě model „Direct Video Action“. Namísto výhradního spoléhání se na mravenčí práci operátorů, kteří roboty na dálku ovládají a sbírají data, Rhoda svou AI předběžně trénuje na stovkách milionů veřejně dostupných videí z internetu. Díky tomu si systém buduje základní pochopení fyziky, pohybu a interakcí. Tyto znalosti jsou pak doladěny na menším množství specifických robotických dat, což systémům umožňuje zvládat nečekané situace ve výrobě a logistice.

Tato strategie využívání obrovského množství nestrukturovaných video dat k vytvoření všeobecných AI modelů představuje významný odklon od tradiční robotiky. Zrcadlí však přístup k základním modelům (foundation models), který razí giganti jako Nvidia nebo Tesla. Zatímco Tesla trénuje své humanoidy Optimus a autonomní řízení pomocí dat z reálného provozu svých vozů, Nvidia buduje ekosystém pro ostatní skrze platformu Isaac a model GR00T. Rhoda se staví do role dodavatele „mozků“ pro širší průmyslový trh – jde o hardwarově agnostické řešení, které by teoreticky mohlo vdechnout nový život stávajícím robotickým flotilám.

Proč na tom záleží?

Samotný objem tohoto investičního kola Series A pro společnost zaměřenou čistě na software je jasným signálem masivní důvěry investorů, mezi nimiž nechybí Khosla Ventures nebo Temasek. Naznačuje to, že trh věří, že skutečná hodnota příští vlny automatizace nespočívá v samotných robotických pažích a úchopech, ale v inteligenci, která je pohání.

Tím, že Rhoda AI trénuje roboty na nekonečném chaosu internetu, sází na to, že dokáže vytvořit škálovatelnou a adaptabilní inteligenci, která obejde úzké hrdlo tradičního programování. Pokud FutureVision dokáže úspěšně přetavit „znalosti z YouTube“ do spolehlivých úkonů na tovární hale, mohlo by to dramaticky snížit bariéru pro automatizaci komplexních úkolů, které doposud zůstávaly výsadou lidí. Je to odvážný pokus postavit „Android“ pro svět stále schopnějších robotických těl.