ChatPaper.aiChatPaper

Système Multi-Agent pour une Compréhension Globale du Football

Multi-Agent System for Comprehensive Soccer Understanding

May 6, 2025
Auteurs: Jiayuan Rao, Zifeng Li, Haoning Wu, Ya Zhang, Yanfeng Wang, Weidi Xie
cs.AI

Résumé

Les récents progrès dans la compréhension du football pilotée par l'IA ont démontré une avancée rapide, mais les recherches existantes se concentrent principalement sur des tâches isolées ou restreintes. Pour combler cette lacune, nous proposons un cadre complet pour une compréhension holistique du football. Plus précisément, nous apportons les contributions suivantes dans cet article : (i) nous construisons SoccerWiki, la première base de connaissances multimodale à grande échelle sur le football, intégrant des connaissances riches sur les joueurs, les équipes, les arbitres et les lieux pour permettre un raisonnement basé sur les connaissances ; (ii) nous présentons SoccerBench, le benchmark le plus vaste et le plus complet spécifique au football, comprenant environ 10 000 paires de questions-réponses multimodales (texte, image, vidéo) standardisées à choix multiples, couvrant 13 tâches de compréhension distinctes, élaborées via des pipelines automatisés et une vérification manuelle ; (iii) nous introduisons SoccerAgent, un système multi-agent innovant qui décompose des questions complexes sur le football grâce à un raisonnement collaboratif, exploitant l'expertise du domaine de SoccerWiki et obtenant des performances robustes ; (iv) des évaluations et des ablations approfondies qui benchmarkent les modèles de langage multimodaux (MLLM) de pointe sur SoccerBench, mettant en évidence la supériorité de notre système agentique proposé. Toutes les données et le code sont disponibles publiquement à l'adresse : https://jyrao.github.io/SoccerAgent/.
English
Recent advancements in AI-driven soccer understanding have demonstrated rapid progress, yet existing research predominantly focuses on isolated or narrow tasks. To bridge this gap, we propose a comprehensive framework for holistic soccer understanding. Specifically, we make the following contributions in this paper: (i) we construct SoccerWiki, the first large-scale multimodal soccer knowledge base, integrating rich domain knowledge about players, teams, referees, and venues to enable knowledge-driven reasoning; (ii) we present SoccerBench, the largest and most comprehensive soccer-specific benchmark, featuring around 10K standardized multimodal (text, image, video) multi-choice QA pairs across 13 distinct understanding tasks, curated through automated pipelines and manual verification; (iii) we introduce SoccerAgent, a novel multi-agent system that decomposes complex soccer questions via collaborative reasoning, leveraging domain expertise from SoccerWiki and achieving robust performance; (iv) extensive evaluations and ablations that benchmark state-of-the-art MLLMs on SoccerBench, highlighting the superiority of our proposed agentic system. All data and code are publicly available at: https://jyrao.github.io/SoccerAgent/.

Summary

AI-Generated Summary

PDF171May 7, 2025