Na corrida frenética para construir o cérebro artificial definitivo para robôs humanoides, um cisma filosófico fascinante está vindo à tona. Já não se trata apenas de quem consegue fazer um robô andar ou buscar um refrigerante. A verdadeira guerra está sendo travada na própria arquitetura da mente. De um lado, temos o prodígio — o gênio end-to-end que aprende apenas observando. Do outro, a burocracia meticulosamente organizada. Entrando com confiança neste segundo campo, a Humanoid apresenta seu novo framework de IA, o KinetIQ, um sistema projetado não apenas para controlar um robô, mas para reger uma orquestra inteira deles.
Isso estabelece imediatamente um duelo de titãs com a Figure AI, cujo Helix 02 da Figure: o cérebro de IA que já sabe lavar a louça impressionou o mundo com sua autonomia fluida e de longa duração. Enquanto a Figure aposta em uma rede neural única e unificada que aprende tarefas complexas de múltiplas etapas, a Humanoid ataca o problema — indiscutivelmente mais caótico e industrial — da gestão de frotas. É a batalha entre o virtuoso e o mestre de obras, e o resultado pode definir como os robôs se integrarão ao nosso cotidiano nas próximas décadas.
KinetIQ: A Escada Corporativa da Cognição
O KinetIQ da Humanoid foi construído sobre o que a empresa chama de arquitetura “cross-timescale” (entre escalas de tempo), o que é uma forma sofisticada de descrever um bolo de quatro camadas de comando e controle. É um framework agêntico que pensa como uma corporação, onde cada camada opera em sua própria velocidade e nível de abstração.
No topo da pirâmide está o Sistema 3, o Orquestrador de Frota Agêntico. Este é o “C-suite”, o alto escalão que se integra aos softwares de gestão de fábricas ou armazéns para receber metas de alto nível. Ele opera em uma escala de segundos a minutos, tratando cada robô em sua frota diversificada — seja ele bipedal ou sobre rodas — como um recurso a ser alocado para a máxima eficiência.
Um degrau abaixo está o Sistema 2, o gerente de projetos a nível de robô. Esta camada utiliza um modelo de linguagem omnimodal para interpretar as diretrizes do Sistema 3 e transformá-las em uma sequência de subtarefas para um único robô. Ele raciocina sobre o ambiente e pode alterar seu plano dinamicamente, resolvendo problemas em tempo real.
Dando as instruções momento a momento está o Sistema 1, uma rede Vision-Language-Action (VLA) que atua como o líder de equipe. Operando a ágeis 5-10Hz, ele emite um fluxo contínuo de poses-alvo para as partes do corpo do robô — mãos, torso, pélvis — para executar o plano traçado pelo Sistema 2.
E, finalmente, quem faz o trabalho pesado é o Sistema 0. Este é o controlador de corpo inteiro, rodando a 50Hz e treinado exclusivamente em cerca de 15.000 horas de aprendizado por reforço (RL) em simulação. Seu único e frenético propósito é traduzir as metas de pose vindas de cima em movimentos de articulação estáveis e equilibrados, garantindo que o robô não “beije o chão” ao tentar pegar uma caixa.

Helix 02: O Virtuoso End-to-End
No outro canto do ringue está o Helix 02 da Figure AI, um sistema com uma filosofia fundamentalmente diferente. Em vez de uma burocracia de múltiplas camadas, o Helix 02 é construído em torno de uma rede neural visuomotora única e unificada. Seu mantra é “todos os sensores na entrada, todos os atuadores na saída”, conectando visão, tato e propriocepção diretamente a cada articulação em um sistema contínuo.
Embora também seja hierárquico, sua estrutura é mais comprimida:
- O Sistema 2 cuida do raciocínio semântico de alto nível, de forma semelhante aos escalões superiores do KinetIQ.
- O Sistema 1 é onde a mágica acontece. É uma política poderosa que traduz a percepção diretamente em alvos de articulação de corpo inteiro a uma velocidade de 200Hz.
- O Sistema 0 é a sua fundação para a personificação física, um controlador que garante que os movimentos sejam suaves e estáveis. Mas, ao contrário da abordagem de RL puro do KinetIQ, o Sistema 0 do Helix foi treinado em mais de 1.000 horas de dados de movimento humano, aprendendo as nuances do equilíbrio e coordenação humanos antes de ser refinado com RL. Ele também opera a impressionantes 1 kHz.
Essa abordagem foi o que permitiu à Figure demonstrar seu robô completando autonomamente a tarefa de carregar e descarregar uma máquina de lavar louça por quatro minutos — um feito de autonomia de longo fôlego que continua sendo um marco no setor.
O Conto de Dois Cérebros: Uma Divisão Filosófica
As diferenças entre o KinetIQ e o Helix 02 não são apenas técnicas — elas representam duas visões distintas para o futuro da robótica.
| Recurso | Humanoid KinetIQ | Figure AI Helix 02 |
|---|---|---|
| Objetivo Principal | Orquestração de frotas de robôs diversos | Autonomia de longo fôlego em um único robô |
| Arquitetura | Framework agêntico de 4 camadas | Rede visuomotora unificada de 3 camadas |
| Treino do Sistema 0 | ~15.000 horas de Aprendizado por Reforço puro | 1.000+ horas de dados humanos + RL |
| Velocidade do Sistema 0 | 50 Hz | 1000 Hz (1 kHz) |
| Principal Trunfo | Escalabilidade, confiabilidade e gestão de plataformas variadas. | Fluidez, destreza e aprendizado de tarefas complexas e inéditas. |
| Analogia | Uma empresa de logística de alta performance. | Um atleta solo de elite. |
O design agêntico e em camadas do KinetIQ é pragmático. Ao separar as responsabilidades, a Humanoid pode, teoricamente, melhorar, depurar ou até substituir camadas individuais sem precisar reconstruir todo o sistema. Essa modularidade é ideal para ambientes industriais onde a confiabilidade e a coordenação entre muitas máquinas são fundamentais.
A abordagem end-to-end da Figure é mais ambiciosa em sua busca pela inteligência geral. Ao treinar o sistema com dados humanos, ela visa criar um modelo fundamental para a ação física que seja inerentemente mais gracioso e adaptável ao caos não estruturado do mundo real. O robô aprende como se mover como uma pessoa, não apenas como atingir um objetivo.
A Verdadeira Corrida: Das Demos Brilhantes ao Trabalho Sujo
No fim das contas, a arquitetura superior não será decidida no laboratório, mas no chão de fábrica e em nossas casas. A Humanoid aposta que o prêmio imediato de bilhões de dólares está na logística e na manufatura, onde orquestrar frotas de robôs especializados é o desafio central. O KinetIQ foi feito sob medida para esse mundo.
A Figure AI, com foco em tarefas complexas e centradas no ser humano, parece estar jogando a longo prazo, visando um robô de uso geral que possa, um dia, navegar em qualquer ambiente humano. A destreza impressionante demonstrada — desde manipular comprimidos até dosar volumes precisos em seringas — revela um sistema que está desafiando os limites do controle motor fino.
A disputa está aberta. O futuro da robótica será comandado por um meticuloso gerente de frota de IA ou por um prodígio robótico virtuoso? O KinetIQ é um argumento de peso a favor do primeiro: um sistema projetado não para vídeos de destaque, mas para a dura realidade da operação industrial 24/7. Para saber mais, você pode ler o anúncio original em thehumanoid.ai.













