Coches Autónomos: Conducen como tú (y eso da un poco de miedo)

Seamos sinceros: la promesa de los coches autónomos lleva años colgando frente a nosotros como una zanahoria inalcanzable. Nos han vendido chóferes robóticos, trayectos sin estrés y la posibilidad de, por fin, terminar el crucigrama de camino a la oficina. Pero la realidad ha sido, por decir lo menos, un camino lleno de baches.

Hasta ahora, al menos. Un nuevo estudio está causando sensación con un enfoque sorprendentemente sencillo: dejar que los coches aprendan a conducir jugando unos contra otros. Sí, han leído bien. Es como un derbi de demolición, pero gestionado por algoritmos.

Gigaflow: Donde los coches van a la autoescuela (y siembran el caos)

El ingrediente secreto es un sistema llamado “Gigaflow”, un simulador por lotes capaz de sintetizar y entrenar 42 años de experiencia de conducción subjetiva por hora en un solo nodo de 8 GPUs. Imaginen una especie de “Cúpula del Trueno” digital donde los coches autónomos aparecen de la nada, reciben unas reglas básicas (no choques, llega a tu destino) y luego son liberados para batirse en duelo en carreteras virtuales. Aprenden por ensayo y error, adaptándose constantemente a los… llamémoslos “estilos de conducción únicos” de sus rivales.

Dato curioso: En solo 10 días de entrenamiento, estos coches de IA recorrieron más de 
1.600 millones de kilómetros. ¡Eso es más que la distancia de la Tierra a Saturno! 
Eso sí que es un viaje por carretera...

¿El resultado? Una única política de control entrenada exclusivamente mediante el juego autónomo (self-play) que pulveriza los récords anteriores en plataformas como CARLA, nuPlan y el Waymo Open Motion Dataset.

La “función de recompensa minimalista”: Cómo enseñar modales a un coche (más o menos)

Aquí es donde la cosa se pone interesante. Los investigadores no atiborraron a la IA con terabytes de datos de conductores humanos. En su lugar, utilizaron una “función de recompensa minimalista”. Básicamente, los coches reciben “puntos positivos” por:

  • Llegar a su destino.
  • Evitar colisiones.
  • Mantenerse en su carril.
  • No saltarse los semáforos en rojo.
  • Mantener una aceleración razonable.

Es como adiestrar a un cachorro. No necesitas que vea horas de vídeos de perros bien educados; simplemente le das una chuche cuando se sienta y le riñes cuando muerde tus zapatos favoritos.

Lo bueno, lo malo y lo puramente surrealista

La buena noticia es que este enfoque parece funcionar. La política resultante alcanza un rendimiento de vanguardia en múltiples pruebas de conducción autónoma, superando incluso a sistemas entrenados con datos humanos del mundo real. Además, los coches son sorprendentemente robustos: promedian 17,5 años de conducción ininterrumpida entre incidentes dentro de la simulación.

¿La mala noticia? Bueno, si los coches están aprendiendo a conducir como nosotros, eso significa que también están heredando nuestros vicios. Prepárense para ver coches autónomos cerrando el paso a otros, haciendo incorporaciones pasivo-agresivas y, quién sabe, quizás algún episodio de ira de carretera procesado por silicio.

Y lo más hilarante: imaginen un futuro donde los coches autónomos estén programados para ser excesivamente educados, cediendo el paso a cada peatón y dejando que todo el mundo se cuele delante. El tráfico se detendría por completo mientras estos vehículos hiper-corteses entran en bucles infinitos de “pase usted, no, por favor, pase usted”.

El futuro es (con suerte) menos accidentado

Por supuesto, aún queda mucho camino por recorrer. Como señalan los propios investigadores, muchas de las infracciones cometidas por la IA durante las pruebas se debieron a limitaciones de los propios entornos de prueba, como peatones que se lanzan al tráfico sin mirar. Pero el hecho de que los coches autónomos puedan aprender a navegar en entornos complejos e impredecibles mediante el juego autónomo es un paso de gigante.

Así que, la próxima vez que vean un coche autónomo por la calle, recuerden que probablemente ha sobrevivido a más atascos y sustos simulados de los que ustedes verán en toda su vida. Y si les corta el paso, no se lo tomen como algo personal: probablemente solo está aprendiendo de los mejores (o de los peores) de nosotros.

Nota del editor: Ningún coche real sufrió daños durante la creación de este sistema de IA. 
Aunque algunos virtuales definitivamente tuvieron un día de perros en la oficina.

Fuente: Robust Autonomy Emerges from Self-Play