La robótica no tendrá un momento ChatGPT, dicen …

El capital riesgo fluye a raudales, los vídeos en YouTube acumulan millones de reproducciones y las promesas son cada vez más audaces trimestre tras trimestre. Tras ver cómo los modelos de lenguaje de gran tamaño (LLM), con ChatGPT de OpenAI a la cabeza, conquistaban el mundo digital de la noche a la mañana, todo el mundo se hace la misma pregunta de los mil millones de dólares: ¿cuándo vivirá la robótica su propio “momento ChatGPT”?

Según dos hombres que han estado en la primera línea de fuego de la IA física (embodied AI), la respuesta es tajante: nunca ocurrirá. Y haríamos bien en escucharlos. Jonathan W. Hurst, cofundador de Agility Robotics (los cerebros tras el humanoide Digit), y Hans Peter Brøndmo, quien lideró el ambicioso proyecto Everyday Robots en Google X, acaban de publicar un necesario baño de realidad. Han llegado para lanzar un balde de agua helada —de grado industrial— sobre el tren del hype, argumentando que no existe un avance mágico y único de la IA que vaya a salvar el día. El camino hacia un mundo lleno de robots útiles está empedrado de un trabajo de ingeniería agotador, incremental y profundamente poco glamuroso.

Con la financiación de capital riesgo para la robótica alcanzando los 6.100 millones de dólares en 2024 (frente a los 5.100 millones de 2023), lo que hay en juego es astronómico. Pero, como sostienen Hurst y Brøndmo, la brecha entre una demo espectacular y un robot comercialmente viable, seguro y fiable sigue siendo un abismo.

La gran ilusión: deconstruyendo las demos de YouTube

Todos los hemos visto. Vídeos de robots humanoides ejecutando saltos mortales perfectos, bailando en sincronía o realizando coreografías de artes marciales milimétricas. La última sensación viral mostró a los humanoides de Unitree Robotics en una exhibición de kung-fu durante la Gala de la Fiesta de la Primavera de 2026 en China; un despliegue de coordinación impresionante a escasos metros de niños artistas.

Hurst y Brøndmo no tardan en señalar lo que los expertos saben desde hace años: “nunca te fíes de un vídeo de robots en YouTube”. Estas actuaciones, aunque técnicamente asombrosas, son el equivalente robótico a un espectáculo de Broadway meticulosamente ensayado. Demuestran un control motor y una coreografía de bajo nivel admirables, pero su nivel de autonomía real está más cerca de un robot de línea de montaje que de una máquina capaz de pensar. El mundo real —sucio, impredecible y tercamente falto de guion— es un animal completamente distinto. Es el clásico ejemplo de la paradoja de Moravec: tareas que para un humano son triviales, como cruzar una habitación desordenada, son monumentalmente difíciles para un robot, mientras que los cálculos complejos le resultan pan comido.

Los datos: un desafío hercúleo aún sin resolver

Los LLM jugaron con una ventaja masiva: fueron entrenados con internet, una base de datos colosal de texto e imágenes generada por humanos. Los robots no tienen ese lujo. Para aprender, un robot necesita datos del mundo físico, un espacio multidimensional donde las variables incluyen desde los ángulos de las articulaciones y el feedback de fuerza hasta las condiciones de iluminación y los movimientos erráticos de las personas.

La escala de este desafío es vertiginosa. En Everyday Robots, el equipo de Brøndmo ejecutó 240 millones de simulaciones robóticas en 2022 solo para entrenar a un modelo para clasificar basura con cierta competencia. Y eso era para una sola habilidad relativamente sencilla. Ahora, multipliquen ese esfuerzo por el número casi infinito de tareas que esperamos que realice un robot de propósito general. Es un problema de recolección de datos de una magnitud totalmente distinta, y que sigue sin resolverse a gran escala. El proyecto, de hecho, fue clausurado a principios de 2023 como parte de los recortes de gastos de su matriz, Alphabet.

No existirá una “IA robótica” única

La idea de un modelo de IA monolítico capaz de pilotar cualquier robot —ya tenga ruedas, patas, vuele o nade— es pura ciencia ficción. Las realidades físicas de los diferentes cuerpos y entornos son demasiado vastas. Los autores sostienen que la arquitectura ganadora será lo que denominan “IA agéntica”. Esto implica modelos de coordinación de alto nivel que pueden razonar, planificar y delegar tareas a un conjunto de herramientas de IA más pequeñas y especializadas. Un modelo podría encargarse de la locomoción bipedal, otro de la manipulación de precisión y un tercero se dedicaría exclusivamente a la interacción segura entre humanos y robots.

Este enfoque modular, argumentan, provocará una “explosión cámbrica” de máquinas inteligentes y útiles. No será un único Big Bang, sino un florecimiento de capacidades diversas y especializadas que, orquestadas correctamente, crearán una máquina verdaderamente competente.

El hardware sigue siendo un dolor de muelas

Por mucho que nos centremos en la IA, un robot sigue siendo un objeto físico. Y el hardware, especialmente las piezas que le permiten interactuar con el entorno, sigue siendo el principal cuello de botella. La mayoría de los robots industriales utilizan actuadores rígidos y potentes que son fantásticos para la precisión en una zona vallada, pero desastrosos en un entorno humano. Una simple colisión accidental podría ser catastrófica.

Los humanos, por el contrario, somos “flexibles” (compliant). Utilizamos el tacto y el feedback de fuerza constantemente, ya sea al encajar una llave en una cerradura o al apoyarnos en un mostrador. Para que los robots logren esto, necesitan una nueva clase de actuadores que sean sensibles, flexibles y conscientes de la fuerza. Aunque existen en los laboratorios, aún no están disponibles a la escala, el coste o la fiabilidad necesarios para un despliegue masivo. La IA más brillante del mundo es inútil si su cuerpo es un estorbo torpe y peligroso.

El valor real está en resolver problemas “fáciles”

La verdad final, y quizás la más importante, es que el valor en el mundo real no viene de los saltos mortales. Viene de realizar de forma fiable las tareas mundanas, repetitivas y a menudo físicamente agotadoras que los humanos no quieren hacer. Aquí es donde la teoría choca con la realidad del suelo de un almacén.

Ambos autores hablan desde la experiencia. Cuando Agility Robotics empezó a desplegar a Digit en instalaciones de clientes con socios como GXO Logistics, se dieron cuenta rápidamente de que su primer gran obstáculo no era la ejecución de la tarea, sino la seguridad. Esto llevó a un esfuerzo de ingeniería de varios años para rediseñar el robot y que pudiera operar de forma segura en espacios compartidos con personas. Del mismo modo, el equipo de Everyday Robots en Google aprendió de primera mano lo caótico y difícil que resulta para un robot un entorno aparentemente simple como la cafetería de una oficina.

Esta experiencia en el mundo real es el único camino a seguir. Es lo que define la arquitectura de la IA, lo que resalta las deficiencias del hardware y lo que aterriza las ambiciosas hojas de ruta en la cruda realidad de las necesidades del cliente. No existe un algoritmo milagroso ni un conjunto de datos que pueda sustituir el proceso lento, doloroso y costoso de desplegar robots, ver cómo fallan y diseñar soluciones meticulosamente. El futuro de la robótica está llegando, pero lo hará paso a paso, con paso firme y bien calculado.

La robótica no tendrá un momento ChatGPT, dicen expertos

La gran ilusión: deconstruyendo las demos de YouTube

Los datos: un desafío hercúleo aún sin resolver

No existirá una “IA robótica” única

El hardware sigue siendo un dolor de muelas

El valor real está en resolver problemas “fáciles”

Envíanos una corrección o sugerencia

LimX Luna cambia tareas por coreografías en duelo de baile