ChatPaper.aiChatPaper

Sistema Multi-Agente per la Comprensione Completa del Calcio

Multi-Agent System for Comprehensive Soccer Understanding

May 6, 2025
Autori: Jiayuan Rao, Zifeng Li, Haoning Wu, Ya Zhang, Yanfeng Wang, Weidi Xie
cs.AI

Abstract

I recenti progressi nella comprensione del calcio guidata dall'intelligenza artificiale hanno dimostrato un rapido avanzamento, tuttavia la ricerca esistente si concentra prevalentemente su compiti isolati o ristretti. Per colmare questa lacuna, proponiamo un framework completo per una comprensione olistica del calcio. Nello specifico, in questo articolo facciamo i seguenti contributi: (i) costruiamo SoccerWiki, la prima knowledge base multimodale su larga scala dedicata al calcio, integrando una ricca conoscenza di dominio su giocatori, squadre, arbitri e stadi per abilitare il ragionamento basato sulla conoscenza; (ii) presentiamo SoccerBench, il benchmark più ampio e completo specifico per il calcio, caratterizzato da circa 10K coppie di domande a scelta multipla multimodali (testo, immagine, video) standardizzate su 13 distinti compiti di comprensione, curate attraverso pipeline automatizzate e verifica manuale; (iii) introduciamo SoccerAgent, un innovativo sistema multi-agente che scompone domande complesse sul calcio tramite ragionamento collaborativo, sfruttando l'esperienza di dominio di SoccerWiki e ottenendo prestazioni robuste; (iv) valutazioni estensive e ablazioni che confrontano i migliori MLLM su SoccerBench, evidenziando la superiorità del nostro sistema agente proposto. Tutti i dati e il codice sono pubblicamente disponibili all'indirizzo: https://jyrao.github.io/SoccerAgent/.
English
Recent advancements in AI-driven soccer understanding have demonstrated rapid progress, yet existing research predominantly focuses on isolated or narrow tasks. To bridge this gap, we propose a comprehensive framework for holistic soccer understanding. Specifically, we make the following contributions in this paper: (i) we construct SoccerWiki, the first large-scale multimodal soccer knowledge base, integrating rich domain knowledge about players, teams, referees, and venues to enable knowledge-driven reasoning; (ii) we present SoccerBench, the largest and most comprehensive soccer-specific benchmark, featuring around 10K standardized multimodal (text, image, video) multi-choice QA pairs across 13 distinct understanding tasks, curated through automated pipelines and manual verification; (iii) we introduce SoccerAgent, a novel multi-agent system that decomposes complex soccer questions via collaborative reasoning, leveraging domain expertise from SoccerWiki and achieving robust performance; (iv) extensive evaluations and ablations that benchmark state-of-the-art MLLMs on SoccerBench, highlighting the superiority of our proposed agentic system. All data and code are publicly available at: https://jyrao.github.io/SoccerAgent/.
PDF231May 7, 2025