Recopilación de Datos Adversariales: Perturbaciones Colaborativas con Humanos para un Aprendizaje por Imitación Robótico Eficiente y Robusto
Adversarial Data Collection: Human-Collaborative Perturbations for Efficient and Robust Robotic Imitation Learning
March 14, 2025
Autores: Siyuan Huang, Yue Liao, Siyuan Feng, Shu Jiang, Si Liu, Hongsheng Li, Maoqing Yao, Guanghui Ren
cs.AI
Resumen
La búsqueda de eficiencia en los datos, donde la calidad supera a la cantidad, ha surgido como un pilar fundamental en la manipulación robótica, especialmente dado los altos costos asociados con la recopilación de datos en el mundo real. Proponemos que maximizar la densidad informativa de demostraciones individuales puede reducir drásticamente la dependencia de grandes conjuntos de datos mientras mejora el rendimiento en las tareas. Con este fin, presentamos la Recopilación de Datos Adversariales (Adversarial Data Collection, ADC), un marco de trabajo con Humanos en el Ciclo (Human-in-the-Loop, HiL) que redefine la adquisición de datos robóticos mediante interacciones bidireccionales en tiempo real entre humanos y el entorno. A diferencia de los enfoques convencionales que registran pasivamente demostraciones estáticas, ADC adopta un paradigma de perturbación colaborativa: durante un solo episodio, un operador adversario altera dinámicamente los estados de los objetos, las condiciones ambientales y los comandos lingüísticos, mientras que el teleoperador ajusta adaptativamente las acciones para superar estos desafíos en evolución. Este proceso comprime comportamientos diversos de recuperación ante fallos, variaciones composicionales de tareas y perturbaciones ambientales en demostraciones mínimas. Nuestros experimentos demuestran que los modelos entrenados con ADC logran una generalización composicional superior ante instrucciones de tareas no vistas, una mayor robustez frente a perturbaciones perceptivas y capacidades emergentes de recuperación de errores. Sorprendentemente, los modelos entrenados con solo el 20% del volumen de demostraciones recopiladas mediante ADC superan significativamente a los enfoques tradicionales que utilizan conjuntos de datos completos. Estos avances cierran la brecha entre los paradigmas de aprendizaje centrados en datos y el despliegue práctico de robots, demostrando que la adquisición estratégica de datos, no solo el procesamiento posterior, es crucial para el aprendizaje robótico escalable en el mundo real. Además, estamos curando un conjunto de datos a gran escala, ADC-Robotics, que incluye tareas de manipulación en el mundo real con perturbaciones adversarias. Este punto de referencia será de código abierto para facilitar avances en el aprendizaje por imitación robótica.
English
The pursuit of data efficiency, where quality outweighs quantity, has emerged
as a cornerstone in robotic manipulation, especially given the high costs
associated with real-world data collection. We propose that maximizing the
informational density of individual demonstrations can dramatically reduce
reliance on large-scale datasets while improving task performance. To this end,
we introduce Adversarial Data Collection, a Human-in-the-Loop (HiL) framework
that redefines robotic data acquisition through real-time, bidirectional
human-environment interactions. Unlike conventional pipelines that passively
record static demonstrations, ADC adopts a collaborative perturbation paradigm:
during a single episode, an adversarial operator dynamically alters object
states, environmental conditions, and linguistic commands, while the
tele-operator adaptively adjusts actions to overcome these evolving challenges.
This process compresses diverse failure-recovery behaviors, compositional task
variations, and environmental perturbations into minimal demonstrations. Our
experiments demonstrate that ADC-trained models achieve superior compositional
generalization to unseen task instructions, enhanced robustness to perceptual
perturbations, and emergent error recovery capabilities. Strikingly, models
trained with merely 20% of the demonstration volume collected through ADC
significantly outperform traditional approaches using full datasets. These
advances bridge the gap between data-centric learning paradigms and practical
robotic deployment, demonstrating that strategic data acquisition, not merely
post-hoc processing, is critical for scalable, real-world robot learning.
Additionally, we are curating a large-scale ADC-Robotics dataset comprising
real-world manipulation tasks with adversarial perturbations. This benchmark
will be open-sourced to facilitate advancements in robotic imitation learning.Summary
AI-Generated Summary