Sistema Multiagente para la Comprensión Integral del Fútbol
Multi-Agent System for Comprehensive Soccer Understanding
May 6, 2025
Autores: Jiayuan Rao, Zifeng Li, Haoning Wu, Ya Zhang, Yanfeng Wang, Weidi Xie
cs.AI
Resumen
Los recientes avances en la comprensión del fútbol impulsada por IA han demostrado un progreso rápido, aunque la investigación existente se centra principalmente en tareas aisladas o limitadas. Para cerrar esta brecha, proponemos un marco integral para la comprensión holística del fútbol. Específicamente, realizamos las siguientes contribuciones en este artículo: (i) construimos SoccerWiki, la primera base de conocimiento multimodal a gran escala sobre fútbol, integrando un amplio conocimiento del dominio sobre jugadores, equipos, árbitros y estadios para permitir un razonamiento basado en conocimiento; (ii) presentamos SoccerBench, el punto de referencia más grande y completo específico para fútbol, que incluye alrededor de 10K pares de preguntas-respuestas multimodales (texto, imagen, video) de opción múltiple en 13 tareas de comprensión distintas, curadas mediante pipelines automatizados y verificación manual; (iii) introducimos SoccerAgent, un novedoso sistema multiagente que descompone preguntas complejas sobre fútbol mediante un razonamiento colaborativo, aprovechando la experiencia del dominio de SoccerWiki y logrando un rendimiento robusto; (iv) evaluaciones y ablaciones exhaustivas que comparan los MLLMs más avanzados en SoccerBench, destacando la superioridad de nuestro sistema agente propuesto. Todos los datos y el código están disponibles públicamente en: https://jyrao.github.io/SoccerAgent/.
English
Recent advancements in AI-driven soccer understanding have demonstrated rapid
progress, yet existing research predominantly focuses on isolated or narrow
tasks. To bridge this gap, we propose a comprehensive framework for holistic
soccer understanding. Specifically, we make the following contributions in this
paper: (i) we construct SoccerWiki, the first large-scale multimodal soccer
knowledge base, integrating rich domain knowledge about players, teams,
referees, and venues to enable knowledge-driven reasoning; (ii) we present
SoccerBench, the largest and most comprehensive soccer-specific benchmark,
featuring around 10K standardized multimodal (text, image, video) multi-choice
QA pairs across 13 distinct understanding tasks, curated through automated
pipelines and manual verification; (iii) we introduce SoccerAgent, a novel
multi-agent system that decomposes complex soccer questions via collaborative
reasoning, leveraging domain expertise from SoccerWiki and achieving robust
performance; (iv) extensive evaluations and ablations that benchmark
state-of-the-art MLLMs on SoccerBench, highlighting the superiority of our
proposed agentic system. All data and code are publicly available at:
https://jyrao.github.io/SoccerAgent/.Summary
AI-Generated Summary