Aprendizaje de Habilidades Reactivas de Fútbol Basadas en Visión para Robots Humanoides
Learning Vision-Driven Reactive Soccer Skills for Humanoid Robots
November 6, 2025
Autores: Yushi Wang, Changsheng Luo, Penghui Chen, Jianran Liu, Weijian Sun, Tong Guo, Kechang Yang, Biao Hu, Yangang Zhang, Mingguo Zhao
cs.AI
Resumen
El fútbol humanoide representa un desafío representativo para la inteligencia corporeizada, ya que requiere que los robots operen dentro de un bucle percepción-acción estrechamente acoplado. Sin embargo, los sistemas existentes generalmente dependen de módulos desacoplados, lo que resulta en respuestas retardadas y comportamientos incoherentes en entornos dinámicos, mientras que las limitaciones perceptivas del mundo real exacerban aún más estos problemas. En este trabajo, presentamos un controlador unificado basado en aprendizaje por refuerzo que permite a los robots humanoides adquirir habilidades reactivas de fútbol mediante la integración directa de la percepción visual y el control de movimiento. Nuestro enfoque extiende los Adversarial Motion Priors a entornos perceptivos en escenarios dinámicos del mundo real, tendiendo un puente entre la imitación de movimiento y el control dinámico visualmente fundamentado. Introducimos una arquitectura codificador-decodificador combinada con un sistema de percepción virtual que modela las características visuales del mundo real, permitiendo que la política recupere estados privilegiados a partir de observaciones imperfectas y establezca una coordinación activa entre la percepción y la acción. El controlador resultante demuestra una fuerte reactividad, ejecutando consistentemente comportamientos de fútbol coherentes y robustos en diversos escenarios, incluyendo partidos reales de RoboCup.
English
Humanoid soccer poses a representative challenge for embodied intelligence,
requiring robots to operate within a tightly coupled perception-action loop.
However, existing systems typically rely on decoupled modules, resulting in
delayed responses and incoherent behaviors in dynamic environments, while
real-world perceptual limitations further exacerbate these issues. In this
work, we present a unified reinforcement learning-based controller that enables
humanoid robots to acquire reactive soccer skills through the direct
integration of visual perception and motion control. Our approach extends
Adversarial Motion Priors to perceptual settings in real-world dynamic
environments, bridging motion imitation and visually grounded dynamic control.
We introduce an encoder-decoder architecture combined with a virtual perception
system that models real-world visual characteristics, allowing the policy to
recover privileged states from imperfect observations and establish active
coordination between perception and action. The resulting controller
demonstrates strong reactivity, consistently executing coherent and robust
soccer behaviors across various scenarios, including real RoboCup matches.