Sistema Multiagente para Compreensão Abrangente de Futebol
Multi-Agent System for Comprehensive Soccer Understanding
May 6, 2025
Autores: Jiayuan Rao, Zifeng Li, Haoning Wu, Ya Zhang, Yanfeng Wang, Weidi Xie
cs.AI
Resumo
Os recentes avanços na compreensão de futebol impulsionada por IA têm demonstrado progresso rápido, mas as pesquisas existentes se concentram predominantemente em tarefas isoladas ou restritas. Para preencher essa lacuna, propomos um framework abrangente para a compreensão holística do futebol. Especificamente, fazemos as seguintes contribuições neste artigo: (i) construímos o SoccerWiki, a primeira base de conhecimento multimodal em larga escala sobre futebol, integrando conhecimento rico do domínio sobre jogadores, times, árbitros e locais para permitir raciocínio baseado em conhecimento; (ii) apresentamos o SoccerBench, o maior e mais abrangente benchmark específico para futebol, contendo cerca de 10 mil pares de perguntas e respostas de múltipla escolha padronizados e multimodais (texto, imagem, vídeo) em 13 tarefas distintas de compreensão, curados por meio de pipelines automatizados e verificação manual; (iii) introduzimos o SoccerAgent, um sistema multiagente inovador que decompõe questões complexas de futebol por meio de raciocínio colaborativo, aproveitando a expertise do domínio do SoccerWiki e alcançando desempenho robusto; (iv) avaliações extensivas e análises ablativas que comparam os MLLMs (Modelos Multimodais de Linguagem) de última geração no SoccerBench, destacando a superioridade do nosso sistema agencial proposto. Todos os dados e códigos estão disponíveis publicamente em: https://jyrao.github.io/SoccerAgent/.
English
Recent advancements in AI-driven soccer understanding have demonstrated rapid
progress, yet existing research predominantly focuses on isolated or narrow
tasks. To bridge this gap, we propose a comprehensive framework for holistic
soccer understanding. Specifically, we make the following contributions in this
paper: (i) we construct SoccerWiki, the first large-scale multimodal soccer
knowledge base, integrating rich domain knowledge about players, teams,
referees, and venues to enable knowledge-driven reasoning; (ii) we present
SoccerBench, the largest and most comprehensive soccer-specific benchmark,
featuring around 10K standardized multimodal (text, image, video) multi-choice
QA pairs across 13 distinct understanding tasks, curated through automated
pipelines and manual verification; (iii) we introduce SoccerAgent, a novel
multi-agent system that decomposes complex soccer questions via collaborative
reasoning, leveraging domain expertise from SoccerWiki and achieving robust
performance; (iv) extensive evaluations and ablations that benchmark
state-of-the-art MLLMs on SoccerBench, highlighting the superiority of our
proposed agentic system. All data and code are publicly available at:
https://jyrao.github.io/SoccerAgent/.