Robô tenista aprende com dados falhos e vence o próprio criador | RoboHorizon Robot Magazine

Em uma reviravolta que não deve surpreender absolutamente ninguém que esteja minimamente atento ao ritmo da IA, um pesquisador desenvolveu um robô que aprendeu uma nova habilidade tão bem que, em pouco tempo, derrotou seu próprio mestre. O palco do duelo foi uma quadra de tênis, e o protagonista é o projeto LATENT, que ensinou um humanoide a jogar não a partir de dados perfeitos e profissionais, mas sim de clipes de movimentos humanos totalmente imperfeitos. O resultado? Um robô que agora domina ralis de várias jogadas com uma naturalidade desconcertante.

O projeto, liderado por pesquisadores da Tsinghua University e da Galbot Inc., atacou um dos maiores gargalos da robótica atual: ensinar movimentos complexos e ágeis sem um “manual de instruções” impecável. O sistema deles aprende o que chamam de “espaço de ação latente” a partir de fragmentos de movimentos humanos de tênis que estão longe da perfeição. O “pulo do gato” aqui é uma política de IA de alto nível que atua como um treinador digital, corrigindo e combinando essas habilidades primitivas e falhas para conseguir devolver a bola com sucesso por cima da rede. Todo esse processo é refinado em simulação antes de ser levado para o mundo real em um humanoide Unitree G1 através de uma técnica de sim-to-real transfer.

Um diagrama mostrando o processo de quatro estágios do sistema LATENT: Pré-treinamento do Rastreador de Movimento, Destilação Online, Aprendizado de Política de Alto Nível e Transferência Sim-to-Real.

A prova dos nove está no placar. De acordo com o autor principal, Zhikai Zhang, a curva de aprendizado foi vertiginosa. “No primeiro dia de testes no mundo real, o robô não conseguia devolver uma única bola que eu sacava”, afirmou Zhang. “No último dia do projeto, eu já não conseguia mais ganhar dele.” Para quem quiser mergulhar nos detalhes técnicos ou, quem sabe, treinar seu próprio mestre de tênis robótico, a equipe disponibilizou os detalhes e o código do projeto. Links: Página do Projeto e Repositório no GitHub.

Por que isso é importante?

Não se trata apenas de criar um parceiro de treino para profissionais de tênis solitários. O verdadeiro divisor de águas do sistema LATENT é sua capacidade de aprender com dados “sujos” e imperfeitos. A maioria dos treinamentos robóticos exige datasets meticulosamente curados, que são caros e demorados para produzir. Ao aprender a corrigir e combinar exemplos falhos, essa abordagem pode acelerar drasticamente a forma como ensinamos robôs a realizar tarefas complexas no mundo real. É um passo gigantesco em direção a robôs que podem aprender “no trabalho” em ambientes imprevisíveis — de armazéns a zonas de desastre — sem precisar de uma demonstração perfeita para cada movimento.

Por que isso é importante?

Robô humanoide acerta mortal na parede com OmniRetarget

Robôs com IA superam humanos em manobras de moto

Canhões via VR: O despertar da era Mecha nos campos de batalha

CARA: A revolução dos robôs quadrúpedes movidos a cabos

AGIBOT revela X2-N: o humanoide que troca pernas por rodas

NVIDIA escala Jim Fan para liderar nova elite da robótica

Boring Company atinge marco de escavação totalmente autônoma

Neura MiPa: O primeiro robô doméstico já está em pré-venda

UGOKU Pad traz controle via smartphone ao Gyroscopic Device Gen2

Loki Robotics: O robô que assume o trabalho sujo do escritório

EngineAI lança robô humanoide PM01 por impressionantes US$ 13.700

Estratégia Europeia de Robótica: Aberta, Mas Não Ingênua

IA e robótica: qual o real sentimento da sociedade americana?