Duelo de IAs: KinetIQ da Humanoid desafia o Helix 02 da Figure

Na corrida frenética para construir o cérebro artificial definitivo para robôs humanoides, um cisma filosófico fascinante está vindo à tona. Já não se trata apenas de quem consegue fazer um robô andar ou buscar um refrigerante. A verdadeira guerra está sendo travada na própria arquitetura da mente. De um lado, temos o prodígio — o gênio end-to-end que aprende apenas observando. Do outro, a burocracia meticulosamente organizada. Entrando com confiança neste segundo campo, a Humanoid apresenta seu novo framework de IA, o KinetIQ, um sistema projetado não apenas para controlar um robô, mas para reger uma orquestra inteira deles.

Isso estabelece imediatamente um duelo de titãs com a Figure AI, cujo Helix 02 da Figure: o cérebro de IA que já sabe lavar a louça impressionou o mundo com sua autonomia fluida e de longa duração. Enquanto a Figure aposta em uma rede neural única e unificada que aprende tarefas complexas de múltiplas etapas, a Humanoid ataca o problema — indiscutivelmente mais caótico e industrial — da gestão de frotas. É a batalha entre o virtuoso e o mestre de obras, e o resultado pode definir como os robôs se integrarão ao nosso cotidiano nas próximas décadas.

KinetIQ: A Escada Corporativa da Cognição

O KinetIQ da Humanoid foi construído sobre o que a empresa chama de arquitetura “cross-timescale” (entre escalas de tempo), o que é uma forma sofisticada de descrever um bolo de quatro camadas de comando e controle. É um framework agêntico que pensa como uma corporação, onde cada camada opera em sua própria velocidade e nível de abstração.

No topo da pirâmide está o Sistema 3, o Orquestrador de Frota Agêntico. Este é o “C-suite”, o alto escalão que se integra aos softwares de gestão de fábricas ou armazéns para receber metas de alto nível. Ele opera em uma escala de segundos a minutos, tratando cada robô em sua frota diversificada — seja ele bipedal ou sobre rodas — como um recurso a ser alocado para a máxima eficiência.

Um degrau abaixo está o Sistema 2, o gerente de projetos a nível de robô. Esta camada utiliza um modelo de linguagem omnimodal para interpretar as diretrizes do Sistema 3 e transformá-las em uma sequência de subtarefas para um único robô. Ele raciocina sobre o ambiente e pode alterar seu plano dinamicamente, resolvendo problemas em tempo real.

Dando as instruções momento a momento está o Sistema 1, uma rede Vision-Language-Action (VLA) que atua como o líder de equipe. Operando a ágeis 5-10Hz, ele emite um fluxo contínuo de poses-alvo para as partes do corpo do robô — mãos, torso, pélvis — para executar o plano traçado pelo Sistema 2.

E, finalmente, quem faz o trabalho pesado é o Sistema 0. Este é o controlador de corpo inteiro, rodando a 50Hz e treinado exclusivamente em cerca de 15.000 horas de aprendizado por reforço (RL) em simulação. Seu único e frenético propósito é traduzir as metas de pose vindas de cima em movimentos de articulação estáveis e equilibrados, garantindo que o robô não “beije o chão” ao tentar pegar uma caixa.

Video thumbnail

Helix 02: O Virtuoso End-to-End

No outro canto do ringue está o Helix 02 da Figure AI, um sistema com uma filosofia fundamentalmente diferente. Em vez de uma burocracia de múltiplas camadas, o Helix 02 é construído em torno de uma rede neural visuomotora única e unificada. Seu mantra é “todos os sensores na entrada, todos os atuadores na saída”, conectando visão, tato e propriocepção diretamente a cada articulação em um sistema contínuo.

Embora também seja hierárquico, sua estrutura é mais comprimida:

  • O Sistema 2 cuida do raciocínio semântico de alto nível, de forma semelhante aos escalões superiores do KinetIQ.
  • O Sistema 1 é onde a mágica acontece. É uma política poderosa que traduz a percepção diretamente em alvos de articulação de corpo inteiro a uma velocidade de 200Hz.
  • O Sistema 0 é a sua fundação para a personificação física, um controlador que garante que os movimentos sejam suaves e estáveis. Mas, ao contrário da abordagem de RL puro do KinetIQ, o Sistema 0 do Helix foi treinado em mais de 1.000 horas de dados de movimento humano, aprendendo as nuances do equilíbrio e coordenação humanos antes de ser refinado com RL. Ele também opera a impressionantes 1 kHz.

Essa abordagem foi o que permitiu à Figure demonstrar seu robô completando autonomamente a tarefa de carregar e descarregar uma máquina de lavar louça por quatro minutos — um feito de autonomia de longo fôlego que continua sendo um marco no setor.

O Conto de Dois Cérebros: Uma Divisão Filosófica

As diferenças entre o KinetIQ e o Helix 02 não são apenas técnicas — elas representam duas visões distintas para o futuro da robótica.

RecursoHumanoid KinetIQFigure AI Helix 02
Objetivo PrincipalOrquestração de frotas de robôs diversosAutonomia de longo fôlego em um único robô
ArquiteturaFramework agêntico de 4 camadasRede visuomotora unificada de 3 camadas
Treino do Sistema 0~15.000 horas de Aprendizado por Reforço puro1.000+ horas de dados humanos + RL
Velocidade do Sistema 050 Hz1000 Hz (1 kHz)
Principal TrunfoEscalabilidade, confiabilidade e gestão de plataformas variadas.Fluidez, destreza e aprendizado de tarefas complexas e inéditas.
AnalogiaUma empresa de logística de alta performance.Um atleta solo de elite.

O design agêntico e em camadas do KinetIQ é pragmático. Ao separar as responsabilidades, a Humanoid pode, teoricamente, melhorar, depurar ou até substituir camadas individuais sem precisar reconstruir todo o sistema. Essa modularidade é ideal para ambientes industriais onde a confiabilidade e a coordenação entre muitas máquinas são fundamentais.

A abordagem end-to-end da Figure é mais ambiciosa em sua busca pela inteligência geral. Ao treinar o sistema com dados humanos, ela visa criar um modelo fundamental para a ação física que seja inerentemente mais gracioso e adaptável ao caos não estruturado do mundo real. O robô aprende como se mover como uma pessoa, não apenas como atingir um objetivo.

A Verdadeira Corrida: Das Demos Brilhantes ao Trabalho Sujo

No fim das contas, a arquitetura superior não será decidida no laboratório, mas no chão de fábrica e em nossas casas. A Humanoid aposta que o prêmio imediato de bilhões de dólares está na logística e na manufatura, onde orquestrar frotas de robôs especializados é o desafio central. O KinetIQ foi feito sob medida para esse mundo.

A Figure AI, com foco em tarefas complexas e centradas no ser humano, parece estar jogando a longo prazo, visando um robô de uso geral que possa, um dia, navegar em qualquer ambiente humano. A destreza impressionante demonstrada — desde manipular comprimidos até dosar volumes precisos em seringas — revela um sistema que está desafiando os limites do controle motor fino.

A disputa está aberta. O futuro da robótica será comandado por um meticuloso gerente de frota de IA ou por um prodígio robótico virtuoso? O KinetIQ é um argumento de peso a favor do primeiro: um sistema projetado não para vídeos de destaque, mas para a dura realidade da operação industrial 24/7. Para saber mais, você pode ler o anúncio original em thehumanoid.ai.