Umanoidi a confronto: KinetIQ sfida l'Helix 02 di Figure

Nella corsa all’oro per costruire il cervello artificiale definitivo destinato ai robot umanoidi, sta emergendo uno scisma filosofico affascinante. Non si tratta più solo di chi riesce a far camminare un robot o a fargli prendere una bibita dal frigo; la vera guerra si combatte nell’architettura stessa della mente. Da un lato abbiamo il prodigio: il talento “end-to-end” che impara guardando. Dall’altro, una burocrazia meticolosamente organizzata. Ed è proprio in quest’ultimo campo che Humanoid scende in campo con il suo nuovo framework AI, KinetIQ, un sistema progettato non solo per controllare un singolo robot, ma per dirigere un’intera orchestra meccanica.

Questo posizionamento crea immediatamente un duello serrato con Figure AI, il cui Figure Helix 02: addio codice, ora l'umanoide lava i piatti ha sbalordito il pubblico con un’autonomia fluida e complessa. Mentre Figure punta alla creazione di un’unica rete neurale unificata capace di apprendere task multi-fase, Humanoid affronta il problema, decisamente più sporco e industriale, della gestione delle flotte. È la sfida tra il virtuoso solista e il general contractor: l’esito potrebbe definire il modo in cui i robot si integreranno nel nostro mondo per i decenni a venire.

KinetIQ: Una scalata aziendale verso la cognizione

Il sistema KinetIQ di Humanoid si basa su quella che l’azienda definisce un’architettura “cross-timescale”, un modo elegante per descrivere una torta a quattro strati di comando e controllo. È un framework agentico che ragiona come una multinazionale, dove ogni livello opera con la propria velocità e il proprio grado di astrazione.

In cima alla piramide troviamo il System 3, l’Agentic Fleet Orchestrator. È il “C-suite” del sistema: si integra con i software gestionali di fabbrica o magazzino per ricevere obiettivi macroscopici. Opera su una scala temporale che va dai secondi ai minuti, trattando ogni robot della flotta — sia esso bipede o su ruote — come una risorsa da schierare per massimizzare l’efficienza.

Un gradino sotto c’è il System 2, il project manager a livello di singolo robot. Questo strato utilizza un modello linguistico omni-modale per interpretare le direttive del System 3 e scomporle in una sequenza di sotto-task. Ragiona sull’ambiente circostante e può modificare il piano dinamicamente: in pratica, risolve problemi al volo.

A impartire le istruzioni momento per momento è il System 1, una rete Vision-Language-Action (VLA) che funge da caposquadra. Operando a una frequenza di 5-10 Hz, emette un flusso continuo di pose target per le varie parti del corpo del robot — mani, torso, bacino — per eseguire il piano stabilito dal System 2.

Infine, a fare il lavoro sporco, c’è il System 0. È il controller dell’intero corpo, gira a 50 Hz ed è stato addestrato esclusivamente attraverso circa 15.000 ore di apprendimento per rinforzo (RL) in simulazione. Il suo unico, frenetico scopo è tradurre i target di posa che arrivano dall’alto in movimenti articolari stabili ed equilibrati, assicurandosi che il robot non finisca faccia a terra mentre cerca di sollevare una scatola.

Video thumbnail

Helix 02: Il virtuoso dell’End-to-End

Nell’altro angolo del ring troviamo Helix 02 di Figure AI, un sistema con una filosofia radicalmente diversa. Invece di una burocrazia a più strati, Helix 02 è costruito attorno a un’unica rete neurale visuo-motoria unificata. Il suo mantra è “tutti i sensori in entrata, tutti gli attuatori in uscita”, collegando visione, tatto e propriocezione direttamente a ogni singola articolazione in un unico sistema continuo.

Sebbene sia anch’esso gerarchico, la sua struttura è molto più compressa:

  • Il System 2 gestisce il ragionamento semantico di alto livello, in modo simile ai piani alti di KinetIQ.
  • Il System 1 è dove avviene la magia. È una “policy” potente che traduce la percezione direttamente in target articolari per tutto il corpo a una velocità di 200 Hz.
  • Il System 0 è la base per l’incarnazione fisica, un controller che garantisce movimenti fluidi e stabili. Ma a differenza dell’approccio puramente basato su RL di KinetIQ, il System 0 di Helix è stato addestrato su oltre 1.000 ore di dati di movimento umano, imparando le sfumature dell’equilibrio e della coordinazione umana prima di essere affinato con l’RL. Opera inoltre a una frequenza sbalorditiva di 1 kHz.

È questo approccio che ha permesso a Figure di mostrare il suo robot mentre carica e scarica autonomamente una lavastoviglie per quattro minuti di fila: un’impresa di autonomia a lungo termine che rimane un punto di riferimento nel settore.

Una storia di due cervelli: il divario filosofico

Le differenze tra KinetIQ e Helix 02 non sono solo tecniche: rappresentano due visioni distinte per il futuro della robotica.

CaratteristicaHumanoid KinetIQFigure AI Helix 02
Obiettivo PrimarioOrchestrazione di flotte di robot diversiAutonomia a lungo termine in un singolo robot
ArchitetturaFramework agentico a 4 livelliRete visuo-motoria unificata a 3 livelli
Addestramento System 0~15.000 ore di puro Reinforcement Learning1.000+ ore di dati umani + RL
Velocità System 050 Hz1000 Hz (1 kHz)
Punto di ForzaScalabilità, affidabilità e gestione di piattaforme variegate.Fluidità, destrezza e apprendimento di task complessi e nuovi.
AnalogiaUn’azienda di logistica ben oliata.Un atleta solista altamente specializzato.

Il design agentico e stratificato di KinetIQ è pragmatico. Separando le competenze, Humanoid può teoricamente migliorare, debuggare o persino sostituire i singoli strati senza dover ricostruire l’intero sistema. Questa modularità è l’ideale per i contesti industriali, dove l’affidabilità e il coordinamento tra molte macchine sono fondamentali.

L’approccio end-to-end di Figure è più ambizioso nella sua ricerca di un’intelligenza generale. Addestrando il sistema su dati umani, mira a creare un modello di base per l’azione fisica che sia intrinsecamente più grazioso e adattabile al caos non strutturato del mondo reale. Impara come muoversi come una persona, non solo come raggiungere un obiettivo.

La vera corsa: dai demo spettacolari al lavoro sporco

In ultima analisi, l’architettura superiore non sarà decretata in laboratorio, ma tra le corsie delle fabbriche e nelle nostre case. Humanoid scommette che il premio immediato da miliardi di dollari risieda nella logistica e nella produzione, dove la sfida principale è orchestrare flotte di robot specializzati. KinetIQ è costruito esattamente per quel mondo.

Figure AI, con il suo focus su task complessi e incentrati sull’uomo, sembra giocare una partita a lungo termine, puntando a un vero robot general-purpose capace un giorno di muoversi in qualsiasi ambiente umano. La destrezza mostrata — dal maneggiare pillole al dosare siringhe con precisione — evidenzia un sistema che sta spostando i confini del controllo motorio fine.

La sfida è aperta. Il futuro della robotica sarà guidato da un meticoloso manager di flotte AI o da un virtuoso prodigio meccanico? KinetIQ è un argomento potente a favore del primo: un sistema progettato non per i video virali, ma per la dura realtà di un dispiegamento industriale h24. Per saperne di più, potete consultare l’annuncio originale su thehumanoid.ai (in inglese).