Apprendimento tramite scorciatoie nelle politiche robotiche generaliste: il ruolo della diversità e della frammentazione del dataset
Shortcut Learning in Generalist Robot Policies: The Role of Dataset Diversity and Fragmentation
August 8, 2025
Autori: Youguang Xing, Xu Luo, Junlin Xie, Lianli Gao, Hengtao Shen, Jingkuan Song
cs.AI
Abstract
Le politiche robotiche generaliste addestrate su dataset su larga scala come Open X-Embodiment (OXE) dimostrano prestazioni solide in un'ampia gamma di compiti. Tuttavia, spesso faticano a generalizzare al di là della distribuzione dei loro dati di addestramento. In questo articolo, indaghiamo la causa sottostante di questa limitata capacità di generalizzazione. Identifichiamo l'apprendimento di scorciatoie — la dipendenza da caratteristiche irrilevanti per il compito — come un ostacolo chiave alla generalizzazione. Attraverso un'analisi teorica ed empirica completa, scopriamo due principali contributori all'apprendimento di scorciatoie: (1) la limitata diversità all'interno dei singoli sotto-dataset e (2) significative disparità distribuzionali tra i sotto-dataset, che portano alla frammentazione del dataset. Questi problemi derivano dalla struttura intrinseca dei dataset su larga scala come OXE, tipicamente composti da più sotto-dataset raccolti in modo indipendente in ambienti e incarnazioni variati. Le nostre scoperte forniscono intuizioni cruciali sulle strategie di raccolta dei dataset che possono ridurre l'apprendimento di scorciatoie e migliorare la capacità di generalizzazione delle politiche robotiche generaliste. Inoltre, negli scenari in cui l'acquisizione di nuovi dati su larga scala è impraticabile, dimostriamo che strategie di aumento dei dati robotiche selezionate con cura possono ridurre efficacemente l'apprendimento di scorciatoie nei dataset offline esistenti, migliorando così le capacità di generalizzazione delle politiche robotiche generaliste, ad esempio pi_0, sia in ambienti simulati che nel mondo reale. Ulteriori informazioni sono disponibili su https://lucky-light-sun.github.io/proj/shortcut-learning-in-grps/.
English
Generalist robot policies trained on large-scale datasets such as Open
X-Embodiment (OXE) demonstrate strong performance across a wide range of tasks.
However, they often struggle to generalize beyond the distribution of their
training data. In this paper, we investigate the underlying cause of this
limited generalization capability. We identify shortcut learning -- the
reliance on task-irrelevant features -- as a key impediment to generalization.
Through comprehensive theoretical and empirical analysis, we uncover two
primary contributors to shortcut learning: (1) limited diversity within
individual sub-datasets, and (2) significant distributional disparities across
sub-datasets, leading to dataset fragmentation. These issues arise from the
inherent structure of large-scale datasets like OXE, which are typically
composed of multiple sub-datasets collected independently across varied
environments and embodiments. Our findings provide critical insights into
dataset collection strategies that can reduce shortcut learning and enhance the
generalization ability of generalist robot policies. Moreover, in scenarios
where acquiring new large-scale data is impractical, we demonstrate that
carefully selected robotic data augmentation strategies can effectively reduce
shortcut learning in existing offline datasets, thereby improving
generalization capabilities of generalist robot policies, e.g., pi_0, in
both simulation and real-world environments. More information at
https://lucky-light-sun.github.io/proj/shortcut-learning-in-grps/.