Aprendizagem de Habilidades de Futebol Reativas Orientadas por Visão para Robôs Humanoides
Learning Vision-Driven Reactive Soccer Skills for Humanoid Robots
November 6, 2025
Autores: Yushi Wang, Changsheng Luo, Penghui Chen, Jianran Liu, Weijian Sun, Tong Guo, Kechang Yang, Biao Hu, Yangang Zhang, Mingguo Zhao
cs.AI
Resumo
O futebol humanóide representa um desafio representativo para a inteligência incorporada, exigindo que os robôs operem dentro de um ciclo percepção-ação fortemente acoplado. No entanto, os sistemas existentes geralmente dependem de módulos desacoplados, resultando em respostas atrasadas e comportamentos incoerentes em ambientes dinâmicos, enquanto as limitações perceptivas do mundo real exacerbam ainda mais esses problemas. Neste trabalho, apresentamos um controlador unificado baseado em aprendizado por reforço que permite que robôs humanóides adquiram habilidades reativas de futebol através da integração direta da percepção visual e do controle de movimento. Nossa abordagem estende os Adversarial Motion Priors para configurações perceptivas em ambientes dinâmicos do mundo real, fazendo a ponte entre a imitação de movimento e o controle dinâmico visualmente fundamentado. Introduzimos uma arquitetura codificador-decodificador combinada com um sistema de percepção virtual que modela características visuais do mundo real, permitindo que a política recupere estados privilegiados a partir de observações imperfeitas e estabeleça uma coordenação ativa entre percepção e ação. O controlor resultante demonstra forte reatividade, executando consistentemente comportamentos de futebol coerentes e robustos em vários cenários, incluindo partidas reais da RoboCup.
English
Humanoid soccer poses a representative challenge for embodied intelligence,
requiring robots to operate within a tightly coupled perception-action loop.
However, existing systems typically rely on decoupled modules, resulting in
delayed responses and incoherent behaviors in dynamic environments, while
real-world perceptual limitations further exacerbate these issues. In this
work, we present a unified reinforcement learning-based controller that enables
humanoid robots to acquire reactive soccer skills through the direct
integration of visual perception and motion control. Our approach extends
Adversarial Motion Priors to perceptual settings in real-world dynamic
environments, bridging motion imitation and visually grounded dynamic control.
We introduce an encoder-decoder architecture combined with a virtual perception
system that models real-world visual characteristics, allowing the policy to
recover privileged states from imperfect observations and establish active
coordination between perception and action. The resulting controller
demonstrates strong reactivity, consistently executing coherent and robust
soccer behaviors across various scenarios, including real RoboCup matches.