RACER: Rijke Taalgestuurde Herstelbeleidsregels voor Imitatie LerenRACER: Rich Language-Guided Failure Recovery Policies for Imitation
Learning
Het ontwikkelen van robuuste en corrigeerbare visuomotorbeleidslijnen voor robotmanipulatie is uitdagend vanwege het ontbreken van zelfherstelmechanismen bij storingen en de beperkingen van eenvoudige taalinstructies om robotacties te begeleiden. Om deze problemen aan te pakken, stellen we een schaalbare gegevensgeneratiepijplijn voor die automatisch expertdemonstraties aanvult met hersteltrajecten bij storingen en gedetailleerde taalaantekeningen voor training. Vervolgens introduceren we Rich Language-guided Failure Recovery (RACER), een toezichthouder-acteurframework, dat storingherstelgegevens combineert met rijke taalbeschrijvingen om robotbesturing te verbeteren. RACER bevat een visie-taalmodel (VLM) dat fungeert als een online toezichthouder, gedetailleerde taalbegeleiding biedt voor foutcorrectie en taakuitvoering, en een taal-afhankelijk visuomotorbeleid als een acteur om de volgende acties te voorspellen. Onze experimentele resultaten tonen aan dat RACER beter presteert dan de state-of-the-art Robotic View Transformer (RVT) op RLbench in verschillende evaluatie-instellingen, waaronder standaard langetermijntaken, dynamische doelveranderingstaken en zero-shot ongeziene taken, waarbij superieure prestaties worden behaald in zowel gesimuleerde als echte omgevingen. Video's en code zijn beschikbaar op: https://rich-language-failure-recovery.github.io.