Aprendizagem de Habilidades de Futebol Reativas Orientadas por Visão para Robôs Humanoides

Resumo

O futebol humanóide representa um desafio representativo para a inteligência incorporada, exigindo que os robôs operem dentro de um ciclo percepção-ação fortemente acoplado. No entanto, os sistemas existentes geralmente dependem de módulos desacoplados, resultando em respostas atrasadas e comportamentos incoerentes em ambientes dinâmicos, enquanto as limitações perceptivas do mundo real exacerbam ainda mais esses problemas. Neste trabalho, apresentamos um controlador unificado baseado em aprendizado por reforço que permite que robôs humanóides adquiram habilidades reativas de futebol através da integração direta da percepção visual e do controle de movimento. Nossa abordagem estende os Adversarial Motion Priors para configurações perceptivas em ambientes dinâmicos do mundo real, fazendo a ponte entre a imitação de movimento e o controle dinâmico visualmente fundamentado. Introduzimos uma arquitetura codificador-decodificador combinada com um sistema de percepção virtual que modela características visuais do mundo real, permitindo que a política recupere estados privilegiados a partir de observações imperfeitas e estabeleça uma coordenação ativa entre percepção e ação. O controlor resultante demonstra forte reatividade, executando consistentemente comportamentos de futebol coerentes e robustos em vários cenários, incluindo partidas reais da RoboCup.

English

Humanoid soccer poses a representative challenge for embodied intelligence, requiring robots to operate within a tightly coupled perception-action loop. However, existing systems typically rely on decoupled modules, resulting in delayed responses and incoherent behaviors in dynamic environments, while real-world perceptual limitations further exacerbate these issues. In this work, we present a unified reinforcement learning-based controller that enables humanoid robots to acquire reactive soccer skills through the direct integration of visual perception and motion control. Our approach extends Adversarial Motion Priors to perceptual settings in real-world dynamic environments, bridging motion imitation and visually grounded dynamic control. We introduce an encoder-decoder architecture combined with a virtual perception system that models real-world visual characteristics, allowing the policy to recover privileged states from imperfect observations and establish active coordination between perception and action. The resulting controller demonstrates strong reactivity, consistently executing coherent and robust soccer behaviors across various scenarios, including real RoboCup matches.