Использование локальности для повышения эффективности выборки в робототехническом манипулировании
Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation
June 15, 2024
Авторы: Tong Zhang, Yingdong Hu, Jiacheng You, Yang Gao
cs.AI
Аннотация
Учитывая высокую стоимость сбора робототехнических данных в реальном мире, эффективность выборки является постоянно актуальной задачей в робототехнике. В данной статье мы представляем SGRv2, фреймворк обучения по подражанию, который повышает эффективность выборки за счет улучшенных визуальных и действенных представлений. Центральным элементом дизайна SGRv2 является включение критического индуктивного смещения - локальности действий, которое предполагает, что действия робота в основном определяются целевым объектом и его взаимодействиями с окружающей средой. Обширные эксперименты как в симулированных, так и в реальных условиях демонстрируют, что локальность действий является важным фактором для повышения эффективности выборки. SGRv2 превосходит в задачах RLBench с управлением ключевыми кадрами, используя всего лишь 5 демонстраций, и превосходит базовую модель RVT в 23 из 26 задач. Более того, при оценке на ManiSkill2 и MimicGen с использованием плотного управления, уровень успешности SGRv2 в 2,54 раза выше, чем у SGR. В реальных условиях, всего с восьмью демонстрациями SGRv2 способен выполнять различные задачи с значительно более высоким уровнем успешности по сравнению с базовыми моделями. Веб-сайт проекта: http://sgrv2-robot.github.io
English
Given the high cost of collecting robotic data in the real world, sample
efficiency is a consistently compelling pursuit in robotics. In this paper, we
introduce SGRv2, an imitation learning framework that enhances sample
efficiency through improved visual and action representations. Central to the
design of SGRv2 is the incorporation of a critical inductive bias-action
locality, which posits that robot's actions are predominantly influenced by the
target object and its interactions with the local environment. Extensive
experiments in both simulated and real-world settings demonstrate that action
locality is essential for boosting sample efficiency. SGRv2 excels in RLBench
tasks with keyframe control using merely 5 demonstrations and surpasses the RVT
baseline in 23 of 26 tasks. Furthermore, when evaluated on ManiSkill2 and
MimicGen using dense control, SGRv2's success rate is 2.54 times that of SGR.
In real-world environments, with only eight demonstrations, SGRv2 can perform a
variety of tasks at a markedly higher success rate compared to baseline models.
Project website: http://sgrv2-robot.github.ioSummary
AI-Generated Summary