Aprovechando la Localidad para Mejorar la Eficiencia Muestral en la Manipulación Robótica
Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation
June 15, 2024
Autores: Tong Zhang, Yingdong Hu, Jiacheng You, Yang Gao
cs.AI
Resumen
Dado el alto costo de recolectar datos robóticos en el mundo real, la eficiencia de la muestra es una búsqueda constantemente convincente en robótica. En este documento, presentamos SGRv2, un marco de aprendizaje por imitación que mejora la eficiencia de la muestra a través de representaciones visuales y de acción mejoradas. Central en el diseño de SGRv2 es la incorporación de un sesgo inductivo crítico: la localidad de la acción, que postula que las acciones del robot son predominantemente influenciadas por el objeto objetivo y sus interacciones con el entorno local. Experimentos extensos en entornos simulados y del mundo real demuestran que la localidad de la acción es esencial para aumentar la eficiencia de la muestra. SGRv2 destaca en tareas de RLBench con control de fotograma clave utilizando tan solo 5 demostraciones y supera la línea base de RVT en 23 de 26 tareas. Además, al ser evaluado en ManiSkill2 y MimicGen utilizando control denso, la tasa de éxito de SGRv2 es 2.54 veces mayor que la de SGR. En entornos del mundo real, con tan solo ocho demostraciones, SGRv2 puede realizar una variedad de tareas con una tasa de éxito notablemente más alta en comparación con los modelos base. Sitio web del proyecto: http://sgrv2-robot.github.io
English
Given the high cost of collecting robotic data in the real world, sample
efficiency is a consistently compelling pursuit in robotics. In this paper, we
introduce SGRv2, an imitation learning framework that enhances sample
efficiency through improved visual and action representations. Central to the
design of SGRv2 is the incorporation of a critical inductive bias-action
locality, which posits that robot's actions are predominantly influenced by the
target object and its interactions with the local environment. Extensive
experiments in both simulated and real-world settings demonstrate that action
locality is essential for boosting sample efficiency. SGRv2 excels in RLBench
tasks with keyframe control using merely 5 demonstrations and surpasses the RVT
baseline in 23 of 26 tasks. Furthermore, when evaluated on ManiSkill2 and
MimicGen using dense control, SGRv2's success rate is 2.54 times that of SGR.
In real-world environments, with only eight demonstrations, SGRv2 can perform a
variety of tasks at a markedly higher success rate compared to baseline models.
Project website: http://sgrv2-robot.github.ioSummary
AI-Generated Summary