Real-is-Sim: Reduzindo a Lacuna entre Simulação e Realidade com um Gêmeo Digital Dinâmico para Avaliação de Políticas de Robôs no Mundo Real

Resumo

Os recentes avanços na clonagem de comportamento têm permitido que robôs realizem tarefas de manipulação complexas. No entanto, avaliar com precisão o desempenho do treinamento continua sendo um desafio, especialmente para aplicações do mundo real, uma vez que as perdas na clonagem de comportamento frequentemente apresentam baixa correlação com o sucesso real da tarefa. Consequentemente, os pesquisadores recorrem a métricas de taxa de sucesso derivadas de avaliações no mundo real, que são custosas e demoradas, tornando impraticável a identificação de políticas ótimas e a detecção de sobreajuste ou subajuste. Para abordar esses problemas, propomos o real-is-sim, uma nova estrutura de clonagem de comportamento que incorpora um gêmeo digital dinâmico (baseado em Gaussianas Incorporadas) em todo o pipeline de desenvolvimento de políticas: coleta de dados, treinamento e implantação. Ao alinhar continuamente o mundo simulado com o mundo físico, as demonstrações podem ser coletadas no mundo real com estados extraídos do simulador. O simulador permite representações flexíveis de estados ao renderizar entradas de imagem de qualquer ponto de vista ou extrair informações de estado de baixo nível de objetos incorporados na cena. Durante o treinamento, as políticas podem ser avaliadas diretamente no simulador de maneira offline e altamente paralelizável. Por fim, durante a implantação, as políticas são executadas no simulador, onde o robô real rastreia diretamente as juntas do robô simulado, efetivamente desacoplando a execução da política do hardware real e mitigando os desafios tradicionais de transferência de domínio. Validamos o real-is-sim na tarefa de manipulação PushT, demonstrando uma forte correlação entre as taxas de sucesso obtidas no simulador e as avaliações no mundo real. Vídeos do nosso sistema podem ser encontrados em https://realissim.rai-inst.com.

English

Recent advancements in behavior cloning have enabled robots to perform complex manipulation tasks. However, accurately assessing training performance remains challenging, particularly for real-world applications, as behavior cloning losses often correlate poorly with actual task success. Consequently, researchers resort to success rate metrics derived from costly and time-consuming real-world evaluations, making the identification of optimal policies and detection of overfitting or underfitting impractical. To address these issues, we propose real-is-sim, a novel behavior cloning framework that incorporates a dynamic digital twin (based on Embodied Gaussians) throughout the entire policy development pipeline: data collection, training, and deployment. By continuously aligning the simulated world with the physical world, demonstrations can be collected in the real world with states extracted from the simulator. The simulator enables flexible state representations by rendering image inputs from any viewpoint or extracting low-level state information from objects embodied within the scene. During training, policies can be directly evaluated within the simulator in an offline and highly parallelizable manner. Finally, during deployment, policies are run within the simulator where the real robot directly tracks the simulated robot's joints, effectively decoupling policy execution from real hardware and mitigating traditional domain-transfer challenges. We validate real-is-sim on the PushT manipulation task, demonstrating strong correlation between success rates obtained in the simulator and real-world evaluations. Videos of our system can be found at https://realissim.rai-inst.com.

Real-is-Sim: Reduzindo a Lacuna entre Simulação e Realidade com um Gêmeo Digital Dinâmico para Avaliação de Políticas de Robôs no Mundo Real

Real-is-Sim: Bridging the Sim-to-Real Gap with a Dynamic Digital Twin for Real-World Robot Policy Evaluation

Resumo

Summary

Support

Support