Per anni, i robot umanoidi sono stati gli “adolescenti impacciati” del mondo tecnologico: fenomenali in balletti coreografati e capriole spettacolari, ma disperatamente goffi non appena si chiedeva loro di svolgere un compito domestico utile. L’industria della robotica è rimasta a lungo incagliata nel problema della “loco-manipolazione”—quella sfida diabolicamente complessa che consiste nel far camminare un robot e fargli usare le mani contemporaneamente, senza che finisca per accasciarsi in un cumulo di rimpianti e componenti costosi.
Oggi però entra in scena Figure AI con Helix 02, un nuovo modello di intelligenza artificiale che non si limita a “camminare e masticare una gomma nello stesso momento”; cammina, trasporta piatti delicati e svuota una lavastoviglie in una sequenza autonoma continua di quattro minuti. Non siamo di fronte all’ennesima demo patinata e ultra-breve. È la dimostrazione di una singola rete neurale che controlla l’intero corpo di un umanoide, dai pixel alla coppia motrice (torque), colmando finalmente il divario tra locomozione e manipolazione.
La fine dei robot “Frankenstein”
Tradizionalmente, far fare qualcosa di utile a un umanoide richiedeva un ingombrante “mostro di Frankenstein” fatto di righe di codice. Un controller gestiva la camminata, passava il testimone a un altro per la stabilizzazione, che a sua volta lo passava a un terzo per raggiungere e afferrare un oggetto. Il risultato? Un processo lento, fragile e profondamente innaturale. Se un oggetto si spostava inaspettatamente, l’intero castello di carte logico crollava miseramente.
“La vera autonomia richiede qualcosa di fondamentalmente diverso: un unico sistema di apprendimento che ragioni sull’intero corpo all’unisono”, si legge nell’annuncio di Figure. “Un sistema che percepisce, decide e agisce in modo continuo.”
Questo è il cuore del problema che Helix 02 è stato progettato per risolvere. Invece di cucire insieme sistemi disparati, Figure ha creato un’architettura IA gerarchica che pensa e agisce come un tutto unico.
Un cervello a tre strati per un corpo solo
La magia dietro Helix 02 risiede in un’architettura a tre sistemi, ognuno operante su una propria scala temporale. Immaginatela come una gerarchia aziendale del pensiero, dal CEO che stabilisce la strategia allo stagista che esegue materialmente il lavoro.
- System 2 (Lo Stratega): È lo strato del ragionamento di alto livello. Elabora le scene e il linguaggio, scomponendo un comando come “Svuota la lavastoviglie” in una sequenza di obiettivi. Opera lentamente, concentrandosi sul quadro generale.
- System 1 (Il Tattico): È la policy visuomotoria che connette tutti i sensi del robot—telecamere sulla testa, nuove telecamere sui palmi e sensori tattili sulle dita—a tutte le sue articolazioni. Traduce gli obiettivi del System 2 in comandi rapidi a 200 Hz per tutto il corpo.
- System 0 (L’Atleta): È la base, un modello addestrato su oltre 1.000 ore di dati di movimento umano. Opera alla velocità fulminea di 1 kHz, garantendo che ogni movimento sia stabile, bilanciato e naturale. Con un colpo di classe tecnologico, Figure sottolinea che il System 0 sostituisce 109.504 righe di codice C++ scritto a mano con una singola rete neurale. In pratica, hanno licenziato un’intera biblioteca di codice per assumere un’IA che ha imparato guardando video di esseri umani in binge-watching.

Questa pipeline “pixels-to-whole-body” permette al robot di eseguire 61 distinte azioni di loco-manipolazione nel suo “balletto della lavastoviglie” di quattro minuti, passando fluidamente dal camminare al trasportare, dal posizionare fino all’usare l’anca per chiudere un cassetto quando ha le mani occupate.
Ma cosa sa fare davvero?
Il compito della lavastoviglie è la star dello show, ma l’introduzione di nuovo hardware sul robot Figure 03, nello specifico telecamere sui palmi e sensori tattili, sblocca un nuovo livello di destrezza. Questi sensori forniscono a Helix 02 il feedback necessario per compiti che prima erano fuori portata per i sistemi basati puramente sulla visione.
I sensori tattili possono rilevare forze minuscole, fino a tre grammi: una sensibilità tale da “sentire” una graffetta. Questo abilita una classe completamente nuova di abilità motorie fini.
Destrezza oltre i piatti
Helix 02 è stato messo alla prova in una serie di task complessi per dimostrare le sue doti motorie:
- Svitare il tappo di una bottiglia: Richiede coordinazione bimanuale precisa e controllo della forza per evitare di schiacciare la plastica.
- Prendere una singola pillola da un organizer: Utilizza le telecamere sui palmi per una visione ravvicinata quando le telecamere principali sulla testa sono ostruite.
- Erogare esattamente 5 ml da una siringa: Un compito che richiede feedback tattile per applicare una forza fluida e continua.
- Separare componenti metallici da una scatola disordinata: Un compito reale proveniente dalla fabbrica BotQ di Figure, che mostra la capacità di lavorare in ambienti caotici e imprevedibili.
Analisi: Un cambio di paradigma per gli umanoidi utili
Mentre altre aziende si sono concentrate su robot capaci di imprese atletiche impressionanti, Figure sta puntando sulla sfida, meno glamour ma più critica, di rendere gli umanoidi utili nel mondo reale. Il salto dall’originale Helix, che controllava solo la parte superiore del corpo, all’autonomia total-body di Helix 02 in un solo anno è un indicatore significativo dell’accelerazione dei progressi in questo campo.
Il punto chiave è l’abbandono di comportamenti rigidi e codificati a mano a favore di un sistema adattivo che apprende. Addestrando il suo “foundation model” su un dataset massiccio di movimenti umani, Figure sta integrando una conoscenza innata di come una forma bipede dovrebbe muoversi e restare in equilibrio. Questo permette all’IA di alto livello di concentrarsi su cosa fare, mentre il sistema di basso livello gestisce il come.
Non si tratta tanto di costruire un robot che sappia fare una cosa perfettamente, quanto di creare una piattaforma che possa imparare a fare qualsiasi cosa. Come ha notato il CEO di Figure, Brett Adcock, i miglioramenti alla rete neurale Helix possono essere trasmessi all’intera flotta, permettendo a tutti i robot di beneficiare dell’esperienza di uno solo. E con gli attuatori del robot che operano solo al 20-25% della loro velocità massima, c’è ancora un margine di miglioramento delle prestazioni enorme sull’hardware attuale.
I risultati sono ancora ai primi stadi, ma rappresentano una svolta fondamentale. Risolvendo il problema dell’autonomia continua dell’intero corpo, Figure ha compiuto un passo cruciale verso la creazione di un vero robot general-purpose—uno che, finalmente, potrebbe essere pronto a sbrigare le faccende di casa senza bisogno di complicatissimi algoritmi pre-programmati.













