Apprentissage de compétences footballistiques réactives pilotées par vision pour robots humanoïdes
Learning Vision-Driven Reactive Soccer Skills for Humanoid Robots
November 6, 2025
papers.authors: Yushi Wang, Changsheng Luo, Penghui Chen, Jianran Liu, Weijian Sun, Tong Guo, Kechang Yang, Biao Hu, Yangang Zhang, Mingguo Zhao
cs.AI
papers.abstract
Le football humanoïde représente un défi représentatif pour l'intelligence incarnée, nécessitant que les robots opèrent dans une boucle perception-action étroitement couplée. Cependant, les systèmes existants reposent généralement sur des modules découplés, entraînant des réponses retardées et des comportements incohérents dans des environnements dynamiques, tandis que les limitations perceptives du monde réel exacerbent davantage ces problèmes. Dans ce travail, nous présentons un contrôleur unifié basé sur l'apprentissage par renforcement qui permet aux robots humanoïdes d'acquérir des compétences footballistiques réactives grâce à l'intégration directe de la perception visuelle et du contrôle moteur. Notre approche étend les Adversarial Motion Priors à des contextes perceptifs dans des environnements dynamiques réels, faisant le pont entre l'imitation motrice et le contrôle dynamique ancré visuellement. Nous introduisons une architecture encodeur-décodeur combinée à un système de perception virtuelle modélisant les caractéristiques visuelles du monde réel, permettant à la politique de retrouver des états privilégiés à partir d'observations imparfaites et d'établir une coordination active entre la perception et l'action. Le contrôleur résultant démontre une forte réactivité, exécutant constamment des comportements footballistiques cohérents et robustes dans divers scénarios, y compris lors de véritables matchs de RoboCup.
English
Humanoid soccer poses a representative challenge for embodied intelligence,
requiring robots to operate within a tightly coupled perception-action loop.
However, existing systems typically rely on decoupled modules, resulting in
delayed responses and incoherent behaviors in dynamic environments, while
real-world perceptual limitations further exacerbate these issues. In this
work, we present a unified reinforcement learning-based controller that enables
humanoid robots to acquire reactive soccer skills through the direct
integration of visual perception and motion control. Our approach extends
Adversarial Motion Priors to perceptual settings in real-world dynamic
environments, bridging motion imitation and visually grounded dynamic control.
We introduce an encoder-decoder architecture combined with a virtual perception
system that models real-world visual characteristics, allowing the policy to
recover privileged states from imperfect observations and establish active
coordination between perception and action. The resulting controller
demonstrates strong reactivity, consistently executing coherent and robust
soccer behaviors across various scenarios, including real RoboCup matches.