Het aanleren van visie-gestuurde reactieve voetbalvaardigheden voor humanoïde robots
Learning Vision-Driven Reactive Soccer Skills for Humanoid Robots
November 6, 2025
Auteurs: Yushi Wang, Changsheng Luo, Penghui Chen, Jianran Liu, Weijian Sun, Tong Guo, Kechang Yang, Biao Hu, Yangang Zhang, Mingguo Zhao
cs.AI
Samenvatting
Humanoïd voetbal vormt een representatieve uitdaging voor belichaamde intelligentie, waarbij robots moeten functioneren binnen een sterk gekoppelde perceptie-actielus. Bestaande systemen vertrouwen echter doorgaans op ontkoppelde modules, wat leidt tot vertraagde reacties en onsamenhangend gedrag in dynamische omgevingen, terwijl beperkingen in de werkelijke waarneming deze problemen verder verergeren. In dit werk presenteren we een uniforme, op reinforcement learning gebaseerde controller die humanoïde robots in staat stelt reactieve voetbalvaardigheden te verwerven door directe integratie van visuele perceptie en bewegingscontrole. Onze aanpak breidt Adversarial Motion Priors uit naar perceptuele settings in dynamische real-world omgevingen, waardoor een brug wordt geslagen tussen bewegingsobservatie en visueel verankerde dynamische controle. We introduceren een encoder-decoderarchitectuur gecombineerd met een virtueel perceptiesysteem dat visuele kenmerken van de echte wereld modelleert, waardoor het beleid in staat is geprivilegieerde toestanden te herleiden uit imperfecte observaties en een actieve coördinatie tussen perceptie en actie tot stand te brengen. De resulterende controller toont sterke reactiviteit en voert consistent samenhangend en robuust voetbalgedrag uit in diverse scenario's, inclusief echte RoboCup-wedstrijden.
English
Humanoid soccer poses a representative challenge for embodied intelligence,
requiring robots to operate within a tightly coupled perception-action loop.
However, existing systems typically rely on decoupled modules, resulting in
delayed responses and incoherent behaviors in dynamic environments, while
real-world perceptual limitations further exacerbate these issues. In this
work, we present a unified reinforcement learning-based controller that enables
humanoid robots to acquire reactive soccer skills through the direct
integration of visual perception and motion control. Our approach extends
Adversarial Motion Priors to perceptual settings in real-world dynamic
environments, bridging motion imitation and visually grounded dynamic control.
We introduce an encoder-decoder architecture combined with a virtual perception
system that models real-world visual characteristics, allowing the policy to
recover privileged states from imperfect observations and establish active
coordination between perception and action. The resulting controller
demonstrates strong reactivity, consistently executing coherent and robust
soccer behaviors across various scenarios, including real RoboCup matches.