Reti Evolutive di Competenze Programmatiche

Abstract

Studiamo l'acquisizione continua di abilità in ambienti embodied aperti, in cui un agente deve costruire, affinare e riutilizzare una libreria in espansione di competenze eseguibili. Introduciamo la Programmatic Skill Network (PSN), un framework in cui le abilità sono programmi simbolici eseguibili che formano una rete compositiva che si evolve attraverso l'esperienza. PSN definisce tre meccanismi fondamentali istanziati tramite modelli linguistici di grandi dimensioni: (1) REFLECT per la localizzazione strutturata degli errori nelle composizioni di abilità, (2) un'ottimizzazione progressiva con un meccanismo di aggiornamento basato sulla maturità che stabilizza le abilità affidabili preservando la plasticità per quelle incerte, e (3) una refattorizzazione strutturale canonica con validazione di rollback che mantiene la compattezza della rete. Mostriamo inoltre che le dinamiche di apprendimento della PSN presentano parallelismi strutturali con l'addestramento di reti neurali. Esperimenti su MineDojo e Crafter dimostrano un solido riutilizzo delle abilità, un rapido adattamento e una forte generalizzazione su distribuzioni di compiti aperte.\footnote{Prevediamo di rendere open-source il codice.}

English

We study continual skill acquisition in open-ended embodied environments where an agent must construct, refine, and reuse an expanding library of executable skills. We introduce the Programmatic Skill Network (PSN), a framework in which skills are executable symbolic programs forming a compositional network that evolves through experience. PSN defines three core mechanisms instantiated via large language models: (1)REFLECT for structured fault localization over skill compositions, (2) progressive optimization with maturity-aware update gating that stabilizes reliable skills while maintaining plasticity for uncertain ones, and (3) canonical structural refactoring under rollback validation that maintains network compactness. We further show that PSN's learning dynamics exhibit structural parallels to neural network training. Experiments on MineDojo and Crafter demonstrate robust skill reuse, rapid adaptation, and strong generalization across open-ended task distributions.\footnote{We plan to open-source the code.

Reti Evolutive di Competenze Programmatiche

Evolving Programmatic Skill Networks

Abstract

Support