CoDA : Systèmes agentiels pour la visualisation collaborative de données
CoDA: Agentic Systems for Collaborative Data Visualization
October 3, 2025
papers.authors: Zichen Chen, Jiefeng Chen, Sercan Ö. Arik, Misha Sra, Tomas Pfister, Jinsung Yoon
cs.AI
papers.abstract
Les recherches approfondies ont révolutionné l'analyse des données, mais les scientifiques des données consacrent encore un temps considérable à la création manuelle de visualisations, soulignant la nécessité d'une automatisation robuste à partir de requêtes en langage naturel. Cependant, les systèmes actuels peinent à gérer des ensembles de données complexes contenant plusieurs fichiers et des itérations de raffinement. Les approches existantes, y compris les systèmes simples à agent unique ou multi-agents, simplifient souvent la tâche en se concentrant sur l'analyse initiale des requêtes tout en échouant à gérer de manière robuste la complexité des données, les erreurs de code ou la qualité finale des visualisations. Dans cet article, nous reformulons ce défi en tant que problème collaboratif multi-agents. Nous présentons CoDA, un système multi-agents qui utilise des agents LLM spécialisés pour l'analyse des métadonnées, la planification des tâches, la génération de code et l'auto-réflexion. Nous formalisons ce pipeline, démontrant comment une analyse centrée sur les métadonnées contourne les limites de tokens et comment un raffinement axé sur la qualité garantit la robustesse. Des évaluations approfondies montrent que CoDA obtient des gains substantiels dans le score global, surpassant les bases de référence concurrentes jusqu'à 41,5 %. Ce travail démontre que l'avenir de l'automatisation des visualisations ne réside pas dans la génération isolée de code, mais dans des workflows intégrés et collaboratifs d'agents.
English
Deep research has revolutionized data analysis, yet data scientists still
devote substantial time to manually crafting visualizations, highlighting the
need for robust automation from natural language queries. However, current
systems struggle with complex datasets containing multiple files and iterative
refinement. Existing approaches, including simple single- or multi-agent
systems, often oversimplify the task, focusing on initial query parsing while
failing to robustly manage data complexity, code errors, or final visualization
quality. In this paper, we reframe this challenge as a collaborative
multi-agent problem. We introduce CoDA, a multi-agent system that employs
specialized LLM agents for metadata analysis, task planning, code generation,
and self-reflection. We formalize this pipeline, demonstrating how
metadata-focused analysis bypasses token limits and quality-driven refinement
ensures robustness. Extensive evaluations show CoDA achieves substantial gains
in the overall score, outperforming competitive baselines by up to 41.5%. This
work demonstrates that the future of visualization automation lies not in
isolated code generation but in integrated, collaborative agentic workflows.