Collecte de Données Adversariales : Perturbations Collaboratives Humaines pour un Apprentissage par Imitation Robuste et Efficace en Robotique
Adversarial Data Collection: Human-Collaborative Perturbations for Efficient and Robust Robotic Imitation Learning
March 14, 2025
Auteurs: Siyuan Huang, Yue Liao, Siyuan Feng, Shu Jiang, Si Liu, Hongsheng Li, Maoqing Yao, Guanghui Ren
cs.AI
Résumé
La quête d'efficacité des données, où la qualité prime sur la quantité, est devenue une pierre angulaire dans la manipulation robotique, notamment en raison des coûts élevés associés à la collecte de données dans le monde réel. Nous proposons que maximiser la densité informationnelle des démonstrations individuelles puisse réduire considérablement la dépendance aux jeux de données à grande échelle tout en améliorant les performances des tâches. À cette fin, nous introduisons la Collecte de Données Adversariales (Adversarial Data Collection, ADC), un cadre Humain-dans-la-Boucle (Human-in-the-Loop, HiL) qui redéfinit l'acquisition de données robotiques grâce à des interactions bidirectionnelles en temps réel entre l'humain et l'environnement. Contrairement aux pipelines conventionnels qui enregistrent passivement des démonstrations statiques, l'ADC adopte un paradigme de perturbation collaborative : lors d'un seul épisode, un opérateur adverse modifie dynamiquement les états des objets, les conditions environnementales et les commandes linguistiques, tandis que le télé-opérateur ajuste de manière adaptative les actions pour surmonter ces défis évolutifs. Ce processus compresse des comportements divers de récupération après échec, des variations compositionnelles de tâches et des perturbations environnementales en un nombre minimal de démonstrations. Nos expériences montrent que les modèles entraînés avec l'ADC atteignent une généralisation compositionnelle supérieure face à des instructions de tâches inédites, une robustesse accrue aux perturbations perceptuelles et des capacités émergentes de récupération d'erreurs. De manière frappante, les modèles entraînés avec seulement 20 % du volume de démonstrations collectées via l'ADC surpassent significativement les approches traditionnelles utilisant des jeux de données complets. Ces avancées comblent le fossé entre les paradigmes d'apprentissage centrés sur les données et le déploiement pratique de robots, démontrant qu'une acquisition stratégique des données, et pas seulement un traitement a posteriori, est cruciale pour un apprentissage robotique évolutif dans le monde réel. De plus, nous constituons un jeu de données à grande échelle, ADC-Robotics, comprenant des tâches de manipulation réelles avec des perturbations adverses. Ce benchmark sera open-source pour favoriser les avancées dans l'apprentissage par imitation robotique.
English
The pursuit of data efficiency, where quality outweighs quantity, has emerged
as a cornerstone in robotic manipulation, especially given the high costs
associated with real-world data collection. We propose that maximizing the
informational density of individual demonstrations can dramatically reduce
reliance on large-scale datasets while improving task performance. To this end,
we introduce Adversarial Data Collection, a Human-in-the-Loop (HiL) framework
that redefines robotic data acquisition through real-time, bidirectional
human-environment interactions. Unlike conventional pipelines that passively
record static demonstrations, ADC adopts a collaborative perturbation paradigm:
during a single episode, an adversarial operator dynamically alters object
states, environmental conditions, and linguistic commands, while the
tele-operator adaptively adjusts actions to overcome these evolving challenges.
This process compresses diverse failure-recovery behaviors, compositional task
variations, and environmental perturbations into minimal demonstrations. Our
experiments demonstrate that ADC-trained models achieve superior compositional
generalization to unseen task instructions, enhanced robustness to perceptual
perturbations, and emergent error recovery capabilities. Strikingly, models
trained with merely 20% of the demonstration volume collected through ADC
significantly outperform traditional approaches using full datasets. These
advances bridge the gap between data-centric learning paradigms and practical
robotic deployment, demonstrating that strategic data acquisition, not merely
post-hoc processing, is critical for scalable, real-world robot learning.
Additionally, we are curating a large-scale ADC-Robotics dataset comprising
real-world manipulation tasks with adversarial perturbations. This benchmark
will be open-sourced to facilitate advancements in robotic imitation learning.Summary
AI-Generated Summary