Обучение реактивным футбольным навыкам гуманоидных роботов на основе визуального восприятия
Learning Vision-Driven Reactive Soccer Skills for Humanoid Robots
November 6, 2025
Авторы: Yushi Wang, Changsheng Luo, Penghui Chen, Jianran Liu, Weijian Sun, Tong Guo, Kechang Yang, Biao Hu, Yangang Zhang, Mingguo Zhao
cs.AI
Аннотация
Футбол гуманоидных роботов представляет собой репрезентативную задачу для воплощённого интеллекта, требующую от роботов работы в условиях тесно связанного цикла "восприятие-действие". Однако существующие системы обычно полагаются на разрозненные модули, что приводит к запаздывающим реакциям и несогласованному поведению в динамических средах, а ограничения реального восприятия дополнительно усугубляют эти проблемы. В данной работе мы представляем унифицированный контроллер на основе обучения с подкреплением, который позволяет гуманоидным роботам осваивать реактивные футбольные навыки за счёт прямой интеграции зрительного восприятия и управления движением. Наш подход расширяет метод Adversarial Motion Priors для условий восприятия в реальных динамических средах, создавая мост между имитацией движений и визуально обоснованным динамическим управлением. Мы предлагаем архитектуру кодировщик-декодировщик в сочетании с системой виртуального восприятия, которая моделирует характеристики реального зрительного опыта, позволяя стратегии восстанавливать привилегированные состояния из неидеальных наблюдений и устанавливать активную координацию между восприятием и действием. Полученный контроллер демонстрирует высокую реактивность, стабильно выполняя согласованные и устойчивые футбольные действия в различных сценариях, включая реальные матчи RoboCup.
English
Humanoid soccer poses a representative challenge for embodied intelligence,
requiring robots to operate within a tightly coupled perception-action loop.
However, existing systems typically rely on decoupled modules, resulting in
delayed responses and incoherent behaviors in dynamic environments, while
real-world perceptual limitations further exacerbate these issues. In this
work, we present a unified reinforcement learning-based controller that enables
humanoid robots to acquire reactive soccer skills through the direct
integration of visual perception and motion control. Our approach extends
Adversarial Motion Priors to perceptual settings in real-world dynamic
environments, bridging motion imitation and visually grounded dynamic control.
We introduce an encoder-decoder architecture combined with a virtual perception
system that models real-world visual characteristics, allowing the policy to
recover privileged states from imperfect observations and establish active
coordination between perception and action. The resulting controller
demonstrates strong reactivity, consistently executing coherent and robust
soccer behaviors across various scenarios, including real RoboCup matches.