Sunday AI: ¡Robots aprenden tareas del hogar con un guante!

El secreto mejor guardado de la robótica moderna es que la mayoría de esas demos tan impresionantes no son más que un teatro de marionetas de alta tecnología. Un ejército de operadores humanos, pertrechados con costosos y complejos equipos de teleoperación, dirigen cada movimiento del robot a distancia para generar los datos necesarios y así enseñarle algo mínimamente útil. Es un proceso lento, carísimo y, francamente, imposible de escalar. Tony Zhao y Cheng Chi, dos ex-estudiantes de doctorado de Stanford que decidieron colgar los libros para fundar Sunday AI, analizaron este “callejón sin salida del escalado” y decidieron saltárselo por completo.

Su solución, el motor de un nuevo modelo fundacional llamado ACT-1, es de una sencillez engañosa: si quieres que un robot aprenda una tarea, hazla tú mismo. En lugar de un equipo de teleoperación de 20.000 dólares, los ingenieros de Sunday utilizan un “Guante de Captura de Habilidades” de apenas 200 dólares. Este guante, diseñado para mimetizar la geometría y los sensores de la mano de su robot Memo, registra los matices más sutiles y táctiles del movimiento humano. La premisa es audaz: si un humano puede hacerlo llevando el guante, el robot puede aprenderlo. Sin necesidad de titiriteros.

El cuello de botella de los datos y la solución del guante

En Sunday están convencidos de que la robótica no está estancada por falta de hardware, potencia de cálculo o financiación, sino por una única y definitiva restricción: los datos. Mientras que los grandes modelos de lenguaje (LLM) pudieron engullir internet entero, la robótica carece de un corpus similar de interacciones con el mundo real. Empresas como Tesla pueden aprovechar millones de coches para recopilar datos, pero las startups de robótica no tienen ese lujo. La teleoperación era la respuesta de la industria, pero es un enfoque de fuerza bruta que consume demasiado capital y tiempo.

El Guante de Captura de Habilidades de Sunday AI, que imita la mano del robot Memo.

El Guante de Captura de Habilidades es el elegante atajo de Sunday para sortear este problema. Al descentralizar la recopilación de datos, cualquier persona, en cualquier lugar, puede contribuir al conjunto de entrenamiento sin necesidad de tener un robot físico delante. Esto ofrece dos ventajas competitivas:

  • Eficiencia de capital: Sunday afirma que el guante es dos órdenes de magnitud más barato que una configuración de teleoperación estándar, lo que reduce drásticamente el coste de adquisición de datos.
  • Calidad de los datos: Para tareas que dependen del tacto —como calcular la fuerza necesaria para doblar un calcetín o encajar una copa de vino en el lavavajillas— el guante proporciona una retroalimentación de fuerza natural que la teleoperación remota simplemente no puede replicar.

Este enfoque permite a Sunday capturar datos de cientos de hogares reales y desordenados, construyendo un conjunto de datos que refleja la “cola larga de la vida cotidiana”, como ellos mismos dicen; con gatos metiéndose en el lavavajillas y todo lo demás.

De la mesa del comedor al lavavajillas

Para demostrar de qué es capaz ACT-1, Sunday presentó lo que denomina “la tarea más compleja jamás realizada por un robot de forma autónoma”: recoger una mesa tras la cena y cargar el lavavajillas. No se trata solo de mover objetos. La tarea implica 33 interacciones únicas y un total de 68 movimientos de destreza con 21 objetos diferentes, desde delicadas copas de vino transparentes hasta platos de cerámica y cubiertos de metal.

Durante esta misión de largo alcance, el robot Memo recorre más de 40 metros, tira los restos de comida e incluso pone en marcha el lavavajillas. Es una sinfonía de manipulación de precisión y navegación a escala de habitación controlada por un único modelo end-to-end. El cofundador Tony Zhao admite que rompieron muchísimas copas durante el desarrollo, pero lograron terminar más de 20 demostraciones en vivo sin una sola rotura, un testimonio de la sensibilidad aprendida por el modelo.

Generalización “Zero-Shot” en el mundo real

Un robot que solo funciona en su propio laboratorio no es más que un proyecto de feria científica. Para demostrar la adaptabilidad de ACT-1, el equipo desplegó a Memo en seis Airbnbs desconocidos. El objetivo: recoger la mesa y cargar el lavavajillas sin ningún entrenamiento previo específico para ese entorno.

El robot Memo de Sunday AI realizando tareas en el entorno de un hogar real.

Al condicionar el modelo con mapas 3D durante el entrenamiento, ACT-1 aprende a interpretar nuevas distribuciones de espacio en lugar de memorizar las específicas. Cuando se le suelta en una casa nueva, utiliza el mapa proporcionado para navegar hacia puntos clave, demostrando una capacidad crucial para cualquier robot destinado al caos de un hogar real. Hasta la fecha, ACT-1 es el primer modelo fundacional que combina este nivel de manipulación compleja con navegación condicionada por mapas.

Superando las fronteras de la destreza

Más allá de la maratón del lavavajillas, Sunday también está presumiendo de la delicadeza de ACT-1 con dos retos notoriamente difíciles: doblar calcetines y preparar un café espresso. Mientras otros robots han logrado doblar prendas grandes y predecibles, los calcetines son una pesadilla de materiales deformables y partes que se ocultan a la vista. ACT-1 logra identificar parejas en un montón desordenado, enrollarlas usando movimientos multi-dedo y depositarlas en una cesta.

Por otro lado, manejar una cafetera espresso requiere una combinación de precisión milimétrica y fuerza bruta. El robot realiza un prensado del café en el aire, inserta el portafiltros y genera el par de torsión necesario para bloquearlo antes de pulsar el botón. No son solo demostraciones llamativas; son pruebas cuidadosamente elegidas de la calidad y los matices de los datos que el Guante de Captura de Habilidades puede proporcionar.

La apuesta de Sunday es arriesgada. Al jugárselo todo a un método de recopilación de datos totalmente nuevo, han logrado esquivar el mayor cuello de botella de la industria y producir un modelo con capacidades asombrosas. Puede que el robot Memo, con sus ruedas, no tenga el atractivo de ciencia ficción de un humanoide bípede, pero su inteligencia práctica es innegable. Sunday ha lanzado un órdago al sector, sugiriendo que el futuro de la robótica no lo escribirán los titiriteros, sino aquellos que simplemente le enseñen al robot cómo se hacen las cosas.