Coleta de Dados Adversariais: Perturbações Colaborativas com Humanos para Aprendizado de Imitação Robótica Eficiente e Robusta
Adversarial Data Collection: Human-Collaborative Perturbations for Efficient and Robust Robotic Imitation Learning
March 14, 2025
Autores: Siyuan Huang, Yue Liao, Siyuan Feng, Shu Jiang, Si Liu, Hongsheng Li, Maoqing Yao, Guanghui Ren
cs.AI
Resumo
A busca por eficiência de dados, onde a qualidade supera a quantidade, emergiu como um pilar fundamental na manipulação robótica, especialmente considerando os altos custos associados à coleta de dados no mundo real. Propomos que maximizar a densidade informacional de demonstrações individuais pode reduzir drasticamente a dependência de grandes conjuntos de dados, ao mesmo tempo em que melhora o desempenho das tarefas. Para isso, introduzimos a Coleta de Dados Adversariais (Adversarial Data Collection - ADC), uma estrutura Human-in-the-Loop (HiL) que redefine a aquisição de dados robóticos por meio de interações bidirecionais em tempo real entre humanos e o ambiente. Diferentemente dos pipelines convencionais que registram passivamente demonstrações estáticas, o ADC adota um paradigma de perturbação colaborativa: durante um único episódio, um operador adversário altera dinamicamente os estados dos objetos, as condições ambientais e os comandos linguísticos, enquanto o teleoperador ajusta adaptativamente as ações para superar esses desafios em evolução. Esse processo comprime diversos comportamentos de falha-recuperação, variações composicionais de tarefas e perturbações ambientais em demonstrações mínimas. Nossos experimentos demonstram que modelos treinados com ADC alcançam generalização composicional superior para instruções de tarefas não vistas, maior robustez a perturbações perceptuais e capacidades emergentes de recuperação de erros. Surpreendentemente, modelos treinados com apenas 20% do volume de demonstrações coletadas por meio do ADC superam significativamente abordagens tradicionais que utilizam conjuntos de dados completos. Esses avanços preenchem a lacuna entre paradigmas de aprendizagem centrados em dados e a implantação prática de robótica, demonstrando que a aquisição estratégica de dados, e não apenas o processamento posterior, é crucial para o aprendizado robótico escalável no mundo real. Além disso, estamos organizando um grande conjunto de dados ADC-Robotics, composto por tarefas de manipulação do mundo real com perturbações adversariais. Esse benchmark será disponibilizado como código aberto para impulsionar avanços no aprendizado por imitação robótica.
English
The pursuit of data efficiency, where quality outweighs quantity, has emerged
as a cornerstone in robotic manipulation, especially given the high costs
associated with real-world data collection. We propose that maximizing the
informational density of individual demonstrations can dramatically reduce
reliance on large-scale datasets while improving task performance. To this end,
we introduce Adversarial Data Collection, a Human-in-the-Loop (HiL) framework
that redefines robotic data acquisition through real-time, bidirectional
human-environment interactions. Unlike conventional pipelines that passively
record static demonstrations, ADC adopts a collaborative perturbation paradigm:
during a single episode, an adversarial operator dynamically alters object
states, environmental conditions, and linguistic commands, while the
tele-operator adaptively adjusts actions to overcome these evolving challenges.
This process compresses diverse failure-recovery behaviors, compositional task
variations, and environmental perturbations into minimal demonstrations. Our
experiments demonstrate that ADC-trained models achieve superior compositional
generalization to unseen task instructions, enhanced robustness to perceptual
perturbations, and emergent error recovery capabilities. Strikingly, models
trained with merely 20% of the demonstration volume collected through ADC
significantly outperform traditional approaches using full datasets. These
advances bridge the gap between data-centric learning paradigms and practical
robotic deployment, demonstrating that strategic data acquisition, not merely
post-hoc processing, is critical for scalable, real-world robot learning.
Additionally, we are curating a large-scale ADC-Robotics dataset comprising
real-world manipulation tasks with adversarial perturbations. This benchmark
will be open-sourced to facilitate advancements in robotic imitation learning.Summary
AI-Generated Summary