Pesquisadores da Shanghai Jiao Tong University e da SenseTime Research acabam de revelar o que pode ser o “momento ChatGPT” da robótica móvel. O projeto, batizado de NavFm, é apresentado como o primeiro modelo de fundação do mundo para navegação cross-embodiment (capaz de rodar em diferentes tipos de corpos) e multitarefa. Em bom português: eles estão criando um cérebro de navegação universal que, em teoria, pode ser instalado em qualquer robô para levá-lo do ponto A ao ponto B sem que ele atropele ninguém ou bata na primeira lixeira que encontrar.
O vídeo de demonstração traz um cão-robô genérico que parece ter tirado o diploma de mestre em parkour urbano e etiqueta de calçada.

O quadrúpede desvia com agilidade de pedestres, mantém o foco em um alvo humano mesmo com distrações visuais cruzando seu caminho e chega a executar tarefas de entrega em várias etapas de forma totalmente autônoma. Após receber a missão, ele traça sozinho uma rota que atravessa pontes, calçadas e até lances de escada para chegar ao destino. É uma exibição impressionante de consciência situacional e planejamento de rota, indo muito além do simples controle remoto ou de trajetos pré-programados. Claro que navegar em calçadas impecáveis de um vídeo de demonstração é uma coisa; encarar o caos imprevisível da vida urbana real é outra bem diferente — uma lição que alguns veículos de entrega autônomos estão aprendendo da maneira mais difícil. Robo-vans da China não temem nem concreto nem motos
Por que isso é um divisor de águas?
As palavras-chave aqui são “modelo de fundação” e “cross-embodiment”. Em vez de programar meticulosamente a lógica de navegação para cada novo modelo de robô, um modelo de fundação oferece uma inteligência generalista que pode ser adaptada. Pense nisso como a diferença entre projetar um motor customizado para cada carro e criar um GPS universal que funciona perfeitamente em qualquer veículo, de um patinete a um caminhão.
Se as promessas do NavFm se confirmarem, o mesmo núcleo de inteligência que guia este cão-robô poderia, potencialmente, pilotar um drone de rodas ou um humanoide com o mínimo de ajuste fino. Isso reduziria drasticamente o tempo de desenvolvimento e seria um passo crítico para a criação de robôs de uso geral, capazes de se adaptar a novos “corpos” e ambientes em tempo real.













