Shortcut Learning in Algemene Robotbeleidsregels: De Rol van Datasetdiversiteit en Fragmentatie
Shortcut Learning in Generalist Robot Policies: The Role of Dataset Diversity and Fragmentation
August 8, 2025
Auteurs: Youguang Xing, Xu Luo, Junlin Xie, Lianli Gao, Hengtao Shen, Jingkuan Song
cs.AI
Samenvatting
Algemene robotbeleidsmodellen die getraind zijn op grootschalige datasets zoals Open X-Embodiment (OXE) vertonen sterke prestaties bij een breed scala aan taken. Ze hebben echter vaak moeite om te generaliseren buiten de distributie van hun trainingsdata. In dit artikel onderzoeken we de onderliggende oorzaak van deze beperkte generalisatiecapaciteit. We identificeren shortcut learning – het vertrouwen op taakonrelevante kenmerken – als een belangrijk obstakel voor generalisatie. Door middel van uitgebreide theoretische en empirische analyse onthullen we twee primaire bijdragers aan shortcut learning: (1) beperkte diversiteit binnen individuele sub-datasets, en (2) significante distributieverschillen tussen sub-datasets, wat leidt tot datasetfragmentatie. Deze problemen ontstaan door de inherente structuur van grootschalige datasets zoals OXE, die typisch bestaan uit meerdere sub-datasets die onafhankelijk zijn verzameld in verschillende omgevingen en embodimenten. Onze bevindingen bieden cruciale inzichten in datasetverzamelingsstrategieën die shortcut learning kunnen verminderen en de generalisatiecapaciteit van algemene robotbeleidsmodellen kunnen verbeteren. Bovendien tonen we aan dat, in scenario's waar het verkrijgen van nieuwe grootschalige data onpraktisch is, zorgvuldig geselecteerde robotische data-augmentatiestrategieën effectief shortcut learning in bestaande offline datasets kunnen verminderen, waardoor de generalisatiecapaciteiten van algemene robotbeleidsmodellen, zoals pi_0, worden verbeterd, zowel in simulatie als in real-world omgevingen. Meer informatie is te vinden op https://lucky-light-sun.github.io/proj/shortcut-learning-in-grps/.
English
Generalist robot policies trained on large-scale datasets such as Open
X-Embodiment (OXE) demonstrate strong performance across a wide range of tasks.
However, they often struggle to generalize beyond the distribution of their
training data. In this paper, we investigate the underlying cause of this
limited generalization capability. We identify shortcut learning -- the
reliance on task-irrelevant features -- as a key impediment to generalization.
Through comprehensive theoretical and empirical analysis, we uncover two
primary contributors to shortcut learning: (1) limited diversity within
individual sub-datasets, and (2) significant distributional disparities across
sub-datasets, leading to dataset fragmentation. These issues arise from the
inherent structure of large-scale datasets like OXE, which are typically
composed of multiple sub-datasets collected independently across varied
environments and embodiments. Our findings provide critical insights into
dataset collection strategies that can reduce shortcut learning and enhance the
generalization ability of generalist robot policies. Moreover, in scenarios
where acquiring new large-scale data is impractical, we demonstrate that
carefully selected robotic data augmentation strategies can effectively reduce
shortcut learning in existing offline datasets, thereby improving
generalization capabilities of generalist robot policies, e.g., pi_0, in
both simulation and real-world environments. More information at
https://lucky-light-sun.github.io/proj/shortcut-learning-in-grps/.