ChatPaper.aiChatPaper

Raccolta di Dati Adversariali: Perturbazioni Collaborative Umane per un Apprendimento Imitativo Robotic Efficace e Robusto

Adversarial Data Collection: Human-Collaborative Perturbations for Efficient and Robust Robotic Imitation Learning

March 14, 2025
Autori: Siyuan Huang, Yue Liao, Siyuan Feng, Shu Jiang, Si Liu, Hongsheng Li, Maoqing Yao, Guanghui Ren
cs.AI

Abstract

La ricerca dell'efficienza dei dati, in cui la qualità prevale sulla quantità, è emersa come un pilastro fondamentale nella manipolazione robotica, soprattutto considerando gli elevati costi associati alla raccolta di dati nel mondo reale. Proponiamo che massimizzare la densità informativa delle singole dimostrazioni possa ridurre drasticamente la dipendenza da dataset su larga scala, migliorando al contempo le prestazioni del compito. A tal fine, introduciamo la Raccolta Dati Adversarial (Adversarial Data Collection, ADC), un framework Human-in-the-Loop (HiL) che ridefinisce l'acquisizione di dati robotici attraverso interazioni bidirezionali in tempo reale tra uomo e ambiente. A differenza delle pipeline convenzionali che registrano passivamente dimostrazioni statiche, l'ADC adotta un paradigma di perturbazione collaborativa: durante un singolo episodio, un operatore adversarial modifica dinamicamente gli stati degli oggetti, le condizioni ambientali e i comandi linguistici, mentre il tele-operatore adatta in modo flessibile le azioni per superare queste sfide in evoluzione. Questo processo comprime comportamenti di recupero da errori, variazioni compositive dei compiti e perturbazioni ambientali in dimostrazioni minimali. I nostri esperimenti dimostrano che i modelli addestrati con ADC raggiungono una generalizzazione compositiva superiore per istruzioni di compiti non visti, una maggiore robustezza alle perturbazioni percettive e capacità emergenti di recupero dagli errori. Sorprendentemente, i modelli addestrati con appena il 20% del volume di dimostrazioni raccolte tramite ADC superano significativamente gli approcci tradizionali che utilizzano dataset completi. Questi progressi colmano il divario tra i paradigmi di apprendimento centrati sui dati e il dispiegamento pratico della robotica, dimostrando che l'acquisizione strategica dei dati, non solo l'elaborazione post-hoc, è cruciale per un apprendimento robotico scalabile nel mondo reale. Inoltre, stiamo curando un dataset su larga scala ADC-Robotics, comprendente compiti di manipolazione nel mondo reale con perturbazioni adversarial. Questo benchmark sarà reso open-source per favorire progressi nell'apprendimento per imitazione robotica.
English
The pursuit of data efficiency, where quality outweighs quantity, has emerged as a cornerstone in robotic manipulation, especially given the high costs associated with real-world data collection. We propose that maximizing the informational density of individual demonstrations can dramatically reduce reliance on large-scale datasets while improving task performance. To this end, we introduce Adversarial Data Collection, a Human-in-the-Loop (HiL) framework that redefines robotic data acquisition through real-time, bidirectional human-environment interactions. Unlike conventional pipelines that passively record static demonstrations, ADC adopts a collaborative perturbation paradigm: during a single episode, an adversarial operator dynamically alters object states, environmental conditions, and linguistic commands, while the tele-operator adaptively adjusts actions to overcome these evolving challenges. This process compresses diverse failure-recovery behaviors, compositional task variations, and environmental perturbations into minimal demonstrations. Our experiments demonstrate that ADC-trained models achieve superior compositional generalization to unseen task instructions, enhanced robustness to perceptual perturbations, and emergent error recovery capabilities. Strikingly, models trained with merely 20% of the demonstration volume collected through ADC significantly outperform traditional approaches using full datasets. These advances bridge the gap between data-centric learning paradigms and practical robotic deployment, demonstrating that strategic data acquisition, not merely post-hoc processing, is critical for scalable, real-world robot learning. Additionally, we are curating a large-scale ADC-Robotics dataset comprising real-world manipulation tasks with adversarial perturbations. This benchmark will be open-sourced to facilitate advancements in robotic imitation learning.

Summary

AI-Generated Summary

PDF362March 17, 2025