ChatPaper.aiChatPaper

TRANSIC: Sim-naar-Real Beleidsoverdracht door Leren van Online Correctie

TRANSIC: Sim-to-Real Policy Transfer by Learning from Online Correction

May 16, 2024
Auteurs: Yunfan Jiang, Chen Wang, Ruohan Zhang, Jiajun Wu, Li Fei-Fei
cs.AI

Samenvatting

Leren in simulatie en het overzetten van het geleerde beleid naar de echte wereld heeft het potentieel om generalistische robots mogelijk te maken. De belangrijkste uitdaging van deze aanpak is het aanpakken van simulatie-naar-realiteit (sim-to-real) verschillen. Eerdere methoden vereisen vaak domeinspecifieke kennis a priori. Wij stellen dat een rechtstreekse manier om dergelijke kennis te verkrijgen is door mensen te vragen om het uitvoeren van robotbeleid in de echte wereld te observeren en te assisteren. De robots kunnen dan leren van mensen om verschillende sim-to-real verschillen te overbruggen. Wij stellen TRANSIC voor, een data-gedreven aanpak om succesvolle sim-to-real overdracht mogelijk te maken op basis van een human-in-the-loop raamwerk. TRANSIC stelt mensen in staat om simulatiebeleid aan te vullen om verschillende ongemodelleerde sim-to-real verschillen holistisch te overwinnen door interventie en online correctie. Residueel beleid kan worden geleerd uit menselijke correcties en geïntegreerd worden met simulatiebeleid voor autonome uitvoering. Wij tonen aan dat onze aanpak succesvolle sim-to-real overdracht kan bereiken in complexe en contactrijke manipulatietaken zoals meubelmontage. Door de synergetische integratie van beleid geleerd in simulatie en van mensen, is TRANSIC effectief als een holistische aanpak om verschillende, vaak samen voorkomende sim-to-real verschillen aan te pakken. Het vertoont aantrekkelijke eigenschappen zoals schaalbaarheid met menselijke inspanning. Video's en code zijn beschikbaar op https://transic-robot.github.io/
English
Learning in simulation and transferring the learned policy to the real world has the potential to enable generalist robots. The key challenge of this approach is to address simulation-to-reality (sim-to-real) gaps. Previous methods often require domain-specific knowledge a priori. We argue that a straightforward way to obtain such knowledge is by asking humans to observe and assist robot policy execution in the real world. The robots can then learn from humans to close various sim-to-real gaps. We propose TRANSIC, a data-driven approach to enable successful sim-to-real transfer based on a human-in-the-loop framework. TRANSIC allows humans to augment simulation policies to overcome various unmodeled sim-to-real gaps holistically through intervention and online correction. Residual policies can be learned from human corrections and integrated with simulation policies for autonomous execution. We show that our approach can achieve successful sim-to-real transfer in complex and contact-rich manipulation tasks such as furniture assembly. Through synergistic integration of policies learned in simulation and from humans, TRANSIC is effective as a holistic approach to addressing various, often coexisting sim-to-real gaps. It displays attractive properties such as scaling with human effort. Videos and code are available at https://transic-robot.github.io/
PDF140December 15, 2024