NIST presenta nuevo estándar para evaluar robots humanoides

El Instituto Nacional de Estándares y Tecnología (NIST) de EE. UU. ha decidido que ya es hora de comprobar si la actual hornada de flamantes robots humanoides sirve para algo más que para protagonizar vídeos de marketing con una edición impecable. La agencia ha propuesto un nuevo “Benchmark de Rendimiento Base” (Baseline Performance Benchmark), una carrera de obstáculos estandarizada y diseñada para medir las capacidades reales de los humanoides en el mundo físico, casi una década después de que el DARPA Robotics Challenge (DRC) pusiera a prueba a estas máquinas en un ejercicio de humildad técnica sin precedentes.

Allá por 2013-2014, el DRC nos regaló una mina de oro de “bloopers” robóticos y nos recordó de forma contundente lo difícil que resulta para una máquina algo tan mundano como abrir una puerta. El NIST, que diseñó aquellas pruebas originales, propone ahora un equivalente moderno. El objetivo es establecer un conjunto común de tareas cuantificables que cualquier humanoide comercial que se precie debería ser capaz de ejecutar. Las pruebas propuestas cubren cuatro áreas críticas: Movilidad (escaleras, rampas), Manipulación (girar pomos, usar herramientas), Loco-manipulación (transportar una caja a través de un umbral) y Cognición (planificación de tareas de varios pasos).

Task list for the proposed NIST humanoid robot benchmark

El NIST está desarrollando el aparataje de estas pruebas en colaboración con la industria y planea distribuir gratuitamente un número limitado de estos bancos de pruebas físicos a los fabricantes de robots estadounidenses que participen. La agencia está buscando activamente el feedback de la comunidad robótica para el diseño de los tests, pidiendo básicamente a compañías como Boston Dynamics, Figure AI y Tesla que ayuden a construir la misma vara de medir con la que serán evaluadas.

¿Por qué es esto importante?

Durante años, la industria de la robótica ha estado dominada por demos cuidadosamente coreografiadas que muestran un rendimiento impecable bajo condiciones perfectas. No existe una forma estandarizada de comparar las habilidades del robot de una empresa con el de otra, lo que obliga a clientes e inversores a jugar a las adivinanzas para saber quién tiene tecnología sólida y quién solo tiene un excelente editor de vídeo. Este benchmark del NIST podría, por fin, separar el grano de la paja.

Al crear un conjunto común de tareas repetibles y medibles, el NIST está nivelando el campo de juego. Permitirá una comparación directa y objetiva del rendimiento robótico, distinguiendo a las máquinas verdaderamente funcionales de los prototipos confinados al laboratorio. Para una industria que se encuentra a las puertas de su despliegue comercial, este tipo de validación no es solo útil: es esencial para generar confianza y dirigir el progreso hacia soluciones reales. Puedes encontrar más detalles en la propuesta oficial.