Collecte de Données Adversariales : Perturbations Collaboratives Humaines pour un Apprentissage par Imitation Robuste et Efficace en Robotique

papers.abstract

La quête d'efficacité des données, où la qualité prime sur la quantité, est devenue une pierre angulaire dans la manipulation robotique, notamment en raison des coûts élevés associés à la collecte de données dans le monde réel. Nous proposons que maximiser la densité informationnelle des démonstrations individuelles puisse réduire considérablement la dépendance aux jeux de données à grande échelle tout en améliorant les performances des tâches. À cette fin, nous introduisons la Collecte de Données Adversariales (Adversarial Data Collection, ADC), un cadre Humain-dans-la-Boucle (Human-in-the-Loop, HiL) qui redéfinit l'acquisition de données robotiques grâce à des interactions bidirectionnelles en temps réel entre l'humain et l'environnement. Contrairement aux pipelines conventionnels qui enregistrent passivement des démonstrations statiques, l'ADC adopte un paradigme de perturbation collaborative : lors d'un seul épisode, un opérateur adverse modifie dynamiquement les états des objets, les conditions environnementales et les commandes linguistiques, tandis que le télé-opérateur ajuste de manière adaptative les actions pour surmonter ces défis évolutifs. Ce processus compresse des comportements divers de récupération après échec, des variations compositionnelles de tâches et des perturbations environnementales en un nombre minimal de démonstrations. Nos expériences montrent que les modèles entraînés avec l'ADC atteignent une généralisation compositionnelle supérieure face à des instructions de tâches inédites, une robustesse accrue aux perturbations perceptuelles et des capacités émergentes de récupération d'erreurs. De manière frappante, les modèles entraînés avec seulement 20 % du volume de démonstrations collectées via l'ADC surpassent significativement les approches traditionnelles utilisant des jeux de données complets. Ces avancées comblent le fossé entre les paradigmes d'apprentissage centrés sur les données et le déploiement pratique de robots, démontrant qu'une acquisition stratégique des données, et pas seulement un traitement a posteriori, est cruciale pour un apprentissage robotique évolutif dans le monde réel. De plus, nous constituons un jeu de données à grande échelle, ADC-Robotics, comprenant des tâches de manipulation réelles avec des perturbations adverses. Ce benchmark sera open-source pour favoriser les avancées dans l'apprentissage par imitation robotique.

English

The pursuit of data efficiency, where quality outweighs quantity, has emerged as a cornerstone in robotic manipulation, especially given the high costs associated with real-world data collection. We propose that maximizing the informational density of individual demonstrations can dramatically reduce reliance on large-scale datasets while improving task performance. To this end, we introduce Adversarial Data Collection, a Human-in-the-Loop (HiL) framework that redefines robotic data acquisition through real-time, bidirectional human-environment interactions. Unlike conventional pipelines that passively record static demonstrations, ADC adopts a collaborative perturbation paradigm: during a single episode, an adversarial operator dynamically alters object states, environmental conditions, and linguistic commands, while the tele-operator adaptively adjusts actions to overcome these evolving challenges. This process compresses diverse failure-recovery behaviors, compositional task variations, and environmental perturbations into minimal demonstrations. Our experiments demonstrate that ADC-trained models achieve superior compositional generalization to unseen task instructions, enhanced robustness to perceptual perturbations, and emergent error recovery capabilities. Strikingly, models trained with merely 20% of the demonstration volume collected through ADC significantly outperform traditional approaches using full datasets. These advances bridge the gap between data-centric learning paradigms and practical robotic deployment, demonstrating that strategic data acquisition, not merely post-hoc processing, is critical for scalable, real-world robot learning. Additionally, we are curating a large-scale ADC-Robotics dataset comprising real-world manipulation tasks with adversarial perturbations. This benchmark will be open-sourced to facilitate advancements in robotic imitation learning.

Collecte de Données Adversariales : Perturbations Collaboratives Humaines pour un Apprentissage par Imitation Robuste et Efficace en Robotique

Adversarial Data Collection: Human-Collaborative Perturbations for Efficient and Robust Robotic Imitation Learning

papers.abstract

Support