ChatPaper.aiChatPaper

Apprendimento di Abilità Calcistiche Reattive Guidate dalla Visione per Robot Umanoidi

Learning Vision-Driven Reactive Soccer Skills for Humanoid Robots

November 6, 2025
Autori: Yushi Wang, Changsheng Luo, Penghui Chen, Jianran Liu, Weijian Sun, Tong Guo, Kechang Yang, Biao Hu, Yangang Zhang, Mingguo Zhao
cs.AI

Abstract

Il calcio umanoide rappresenta una sfida rappresentativa per l'intelligenza incarnata, richiedendo ai robot di operare all'interno di un ciclo percezione-azione strettamente accoppiato. Tuttavia, i sistemi esistenti si basano tipicamente su moduli disaccoppiati, con conseguenti risposte ritardate e comportamenti incoerenti in ambienti dinamici, mentre le limitazioni percettive del mondo reale aggravano ulteriormente questi problemi. In questo lavoro, presentiamo un controller unificato basato sull'apprendimento per rinforzo che consente a robot umanoidi di acquisire abilità calcistiche reattive attraverso l'integrazione diretta della percezione visiva e del controllo del movimento. Il nostro approccio estende gli Adversarial Motion Priors a contesti percettivi in ambienti dinamici reali, colmando il divario tra imitazione del movimento e controllo dinamico basato sulla visione. Introduciamo un'architettura encoder-decoder combinata con un sistema di percezione virtuale che modella le caratteristiche visive del mondo reale, consentendo alla policy di recuperare stati privilegiati da osservazioni imperfette e stabilire una coordinazione attiva tra percezione e azione. Il controller risultante dimostra una forte reattività, eseguendo in modo coerente comportamenti calcistici coerenti e robusti in vari scenari, inclusi incontri reali di RoboCup.
English
Humanoid soccer poses a representative challenge for embodied intelligence, requiring robots to operate within a tightly coupled perception-action loop. However, existing systems typically rely on decoupled modules, resulting in delayed responses and incoherent behaviors in dynamic environments, while real-world perceptual limitations further exacerbate these issues. In this work, we present a unified reinforcement learning-based controller that enables humanoid robots to acquire reactive soccer skills through the direct integration of visual perception and motion control. Our approach extends Adversarial Motion Priors to perceptual settings in real-world dynamic environments, bridging motion imitation and visually grounded dynamic control. We introduce an encoder-decoder architecture combined with a virtual perception system that models real-world visual characteristics, allowing the policy to recover privileged states from imperfect observations and establish active coordination between perception and action. The resulting controller demonstrates strong reactivity, consistently executing coherent and robust soccer behaviors across various scenarios, including real RoboCup matches.
PDF32December 2, 2025