Diciamocelo: la maggior parte delle demo di robotica è un balletto coreografato di delusioni, una sequenza di movimenti goffi e lenti che ti fanno chiedere se arriverà prima la morte termica dell’universo o il completamento del compito assegnato. Ma ogni tanto, qualcosa riesce a squarciare questo velo di mediocrità. Oggi, quel qualcosa è GEN-1, il nuovo modello di intelligenza artificiale di Generalist. L’azienda non usa mezzi termini: sostiene di aver creato un “cervello” AI generalista per robot che non si limita a funzionare, ma eccelle.
Generalist presenta GEN-1 come il primo modello capace di “padroneggiare” davvero compiti fisici semplici, e lo fa dati alla mano. Parliamo di tassi di successo medi del 99% in attività dove il suo predecessore, GEN-0, arrivava a malapena a una sufficienza risicata del 64%. Non solo: è tre volte più veloce rispetto allo stato dell’arte precedente e, cosa ancora più incredibile, può apprendere un nuovo compito con appena un’ora di dati specifici. Non siamo di fronte a un semplice aggiornamento incrementale; questo è un potenziale cambio di paradigma verso robot che siano finalmente, e concretamente, validi per il mercato.
Dalle leggi di scala alla maestria fisica
Solo cinque mesi fa, Generalist aveva presentato GEN-0, un modello che forniva la prima vera prova che le “scaling laws” — le leggi di scala alla base dell’ascesa meteorica di LLM come GPT — potessero essere applicate anche alla robotica. Più dati e più potenza di calcolo portavano a prestazioni migliori e più generalizzate. Era un punto fermo a livello accademico, ma GEN-0 non era ancora pronto per il debutto nel mondo reale.
GEN-1 è il risultato di aver spinto quei parametri al massimo. È stato addestrato su un dataset molto più vasto — oltre mezzo milione di ore di dati di interazione fisica ad alta fedeltà — e potenziato da nuovi progressi algoritmici. L’ingrediente segreto, però, è la fonte dei dati. Invece di affidarsi esclusivamente a dataset di teleoperazione costosi e difficili da scalare, la fondamenta di GEN-1 poggia su dati raccolti tramite dispositivi wearable a basso costo indossati da esseri umani. Questo fornisce un ricchissimo corpus di pre-addestramento sulla fisica del mondo reale e su quelle micro-correzioni intuitive che le simulazioni o il controllo remoto spesso non riescono a cogliere.
“Crediamo che GEN-1 sia il primo modello di AI fisica generale a superare una soglia critica: quella della fattibilità commerciale per una vasta gamma di applicazioni,” ha dichiarato l’azienda nell’annuncio ufficiale.

La Santissima Trinità: Affidabilità, Velocità e Improvvisazione
Generalist definisce la “maestria” come la combinazione di tre capacità chiave. Due di queste sono state il pilastro dell’automazione industriale per sessant’anni. È la terza, però, a cambiare completamente le regole del gioco.
Affidabilità e velocità: lo standard industriale, sotto steroidi
Iniziamo dai numeri, che sono semplicemente impressionanti. In test di lunga durata, GEN-1 ha imballato componenti per oltre 1.800 volte consecutive, ha piegato scatole più di 200 volte e ha persino effettuato la manutenzione di un robot aspirapolvere per oltre 200 volte di fila — un robot che si prende cura di un altro robot: il sogno di ogni tech-enthusiast o l’inizio di un film horror molto specifico. Questi compiti sono stati eseguiti per ore senza alcun intervento umano, con un tasso di successo del 99%.
Poi c’è la velocità. I robot alimentati da GEN-1 possono assemblare una scatola in 12,1 secondi, un compito che richiedeva al predecessore circa 34 secondi. Inserire uno smartphone in una custodia richiede 15,5 secondi, ben 2,8 volte più velocemente di prima. Non si tratta solo di spingere i motori al massimo; il modello impara dall’esperienza e sfrutta tecniche di inferenza avanzate per eseguire i compiti in modo più efficiente rispetto alle stesse dimostrazioni umane da cui ha appreso.

Improvvisazione: la scintilla dell’intelligenza
Affidabilità e velocità sono pane quotidiano per i bracci industriali bullonati al pavimento di una fabbrica. Ciò che a loro manca è la capacità di gestire l’universo quando questo si rifiuta di seguire il copione. È qui che entra in gioco l’ “intelligenza improvvisativa” di GEN-1.
Generalist la descrive come una capacità emergente, una forma di “problem-solving a stile libero”. In una demo, un robot che sta preparando un kit di componenti automobilistici urta accidentalmente una rondella. Invece di bloccarsi o fallire l’operazione, il sistema basato su GEN-1 valuta la situazione e si adatta. Potrebbe posare la rondella per afferrarla meglio, usare il bordo di una fessura per riorientarla o persino usare l’altra mano per un assist bimanuale. Queste non sono routine di recupero pre-programmate; sono soluzioni inedite generate al volo, ben al di fuori del set di addestramento. È questa la sottile, enorme differenza tra automazione e autonomia.
Più che un modello, un sistema completo
È fondamentale capire che GEN-1 non è semplicemente un insieme di pesi di un modello. È un sistema completo che include innovazioni nel pre-addestramento, tecniche di post-addestramento e processamento durante l’inferenza. Questo approccio a livello di sistema è ciò che lo rende così efficiente dal punto di vista dei dati, capace di adattarsi simultaneamente a un nuovo corpo robotico e a un nuovo compito con circa un’ora di nuovi dati.

Naturalmente, GEN-1 non è la bacchetta magica per la AGI fisica. L’azienda è la prima a sottolinearne i limiti. Non tutti i compiti raggiungono quel fatidico 99% di successo, e alcune applicazioni industriali richiedono un’affidabilità ancora superiore. Inoltre, l’improvvisazione emergente solleva la questione critica dell’allineamento dell’AI. Un robot capace di risolvere un problema in modo creativo è fantastico, ma bisogna assicurarsi che le sue soluzioni creative non prevedano, per dire, di abbattere un muro per pura efficienza.

Ciononostante, il lancio di GEN-1 sembra una pietra miliare significativa. Rafforza l’idea che scalare i modelli con enormi quantità di dati di interazione fisica reale sia la strada più promettente verso robot generalisti. Puntando su questa triade di prestazioni — fare le cose bene, farle in fretta e sapere cosa fare quando le cose vanno storte — Generalist potrebbe aver appena fatto fare al sogno del robot tuttofare un gigantesco balzo in avanti verso la realtà. Per noi, questo è più di un semplice modello; è il segnale che il mondo fisico sta finalmente per diventare molto più intelligente.
