CMU: i robot imparano dai propri errori

I ricercatori della Carnegie Mellon University e di NVIDIA hanno apparentemente deciso che i robot, un po’ come gli stagisti, dovrebbero imparare dai propri pasticci. Hanno introdotto un nuovo framework chiamato PLD (Probe, Learn, Distill) che consente ai modelli Vision-Language-Action (VLA) di migliorare autonomamente in compiti ad alta precisione. Questo si allontana dal metodo tradizionale e laborioso di insegnare ai robot facendogli imitare le dimostrazioni umane, un approccio scalabile quanto intagliare microchip a mano.

Il metodo PLD è un processo a tre fasi progettato per trasformare il fallimento in una risorsa preziosa. Per prima cosa, il robot sonda i propri limiti tentando un compito con le conoscenze che già possiede. Quando inevitabilmente combina un pasticcio — diciamo, rovesciando una bevanda che avrebbe dovuto servire — interviene una “politica di salvataggio” leggera, addestrata tramite apprendimento per rinforzo residuo, per correggere l’azione. Infine, il sistema distilla questo recupero riuscito, perfezionando il modello principale con i nuovi dati. In sostanza, il robot diventa un po’ più intelligente ogni volta che fallisce, senza bisogno di essere tenuto per mano. Il sistema ha già dimostrato un tasso di successo del 99% sul benchmark LIBERO e del 100% in alcune attività di manipolazione nel mondo reale.

Perché È Importante?

Questo è un passo significativo verso la creazione di robot veramente adattabili. Invece di essere programmati con una libreria di movimenti perfetti per ogni situazione immaginabile, un robot equipaggiato con PLD può generare i propri dati di addestramento da esperienze nuove e imperfette. Questo ciclo di auto-miglioramento potrebbe ridurre drasticamente tempi e costi di sviluppo, rendendo i robot più praticabili per ambienti complessi e non strutturati, come la vostra cucina disastrosamente disordinata. È un passaggio dal “imparare guardando” all’“imparare facendo”, e, cosa ancora più importante, all’“imparare quasi… facendo un pasticcio”.