Politiche ancorate al contatto: il condizionamento al contatto crea modelli di utilità robotica robusti

Abstract

Il paradigma prevalente nell'apprendimento robotico cerca di generalizzare attraverso ambienti, embodiment e compiti utilizzando prompt linguistici a runtime. Un conflitto fondamentale limita questo approccio: il linguaggio è spesso troppo astratto per guidare la comprensione fisica concreta necessaria per una manipolazione robusta. In questo lavoro, introduciamo le Politiche Ancorate al Contatto (CAP), che sostituiscono il condizionamento linguistico con punti di contatto fisico nello spazio. Contemporaneamente, strutturiamo le CAP come una libreria di moduli di utilità modulari piuttosto che come una politica generalista monolitica. Questa scomposizione ci permette di implementare un ciclo di iterazione reale-simulato: costruiamo EgoGym, un benchmark di simulazione leggero, per identificare rapidamente le modalità di fallimento e affinare i nostri modelli e dataset prima del dispiegamento nel mondo reale. Dimostriamo che, condizionando sul contatto e iterando tramite simulazione, le CAP generalizzano a nuovi ambienti ed embodiment immediatamente su tre abilità di manipolazione fondamentali, utilizzando solo 23 ore di dati dimostrativi, e superano le VLA all'avanguardia di grandi dimensioni nelle valutazioni zero-shot del 56%. Tutti i checkpoint dei modelli, il codice, l'hardware, la simulazione e i dataset saranno open-source. Pagina del progetto: https://cap-policy.github.io/

English

The prevalent paradigm in robot learning attempts to generalize across environments, embodiments, and tasks with language prompts at runtime. A fundamental tension limits this approach: language is often too abstract to guide the concrete physical understanding required for robust manipulation. In this work, we introduce Contact-Anchored Policies (CAP), which replace language conditioning with points of physical contact in space. Simultaneously, we structure CAP as a library of modular utility models rather than a monolithic generalist policy. This factorization allows us to implement a real-to-sim iteration cycle: we build EgoGym, a lightweight simulation benchmark, to rapidly identify failure modes and refine our models and datasets prior to real-world deployment. We show that by conditioning on contact and iterating via simulation, CAP generalizes to novel environments and embodiments out of the box on three fundamental manipulation skills while using only 23 hours of demonstration data, and outperforms large, state-of-the-art VLAs in zero-shot evaluations by 56%. All model checkpoints, codebase, hardware, simulation, and datasets will be open-sourced. Project page: https://cap-policy.github.io/

Politiche ancorate al contatto: il condizionamento al contatto crea modelli di utilità robotica robusti

Contact-Anchored Policies: Contact Conditioning Creates Strong Robot Utility Models

Abstract

Support