CoDA: Agentische Systemen voor Collaboratieve Datavisualisatie
CoDA: Agentic Systems for Collaborative Data Visualization
October 3, 2025
Auteurs: Zichen Chen, Jiefeng Chen, Sercan Ö. Arik, Misha Sra, Tomas Pfister, Jinsung Yoon
cs.AI
Samenvatting
Diepgaand onderzoek heeft een revolutie teweeggebracht in data-analyse, maar datawetenschappers besteden nog steeds aanzienlijke tijd aan het handmatig maken van visualisaties, wat de noodzaak benadrukt van robuuste automatisering vanuit natuurlijke taalvragen. Huidige systemen hebben echter moeite met complexe datasets die meerdere bestanden en iteratieve verfijning bevatten. Bestaande benaderingen, waaronder eenvoudige single- of multi-agent systemen, vereenvoudigen de taak vaak te veel, waarbij ze zich richten op het initieel parsen van queries, maar falen in het robuust omgaan met data-complexiteit, codefouten of de uiteindelijke kwaliteit van visualisaties. In dit artikel herformuleren we deze uitdaging als een collaboratief multi-agent probleem. We introduceren CoDA, een multi-agent systeem dat gespecialiseerde LLM-agenten inzet voor metadata-analyse, taakplanning, codegeneratie en zelfreflectie. We formaliseren deze pipeline en demonstreren hoe metadata-gerichte analyse tokenlimieten omzeilt en kwaliteitsgedreven verfijning robuustheid waarborgt. Uitgebreide evaluaties tonen aan dat CoDA aanzienlijke verbeteringen behaalt in de algehele score, waarbij het competitieve baseline-systemen met tot wel 41,5% overtreft. Dit werk toont aan dat de toekomst van visualisatie-automatisering niet ligt in geïsoleerde codegeneratie, maar in geïntegreerde, collaboratieve agent-gebaseerde workflows.
English
Deep research has revolutionized data analysis, yet data scientists still
devote substantial time to manually crafting visualizations, highlighting the
need for robust automation from natural language queries. However, current
systems struggle with complex datasets containing multiple files and iterative
refinement. Existing approaches, including simple single- or multi-agent
systems, often oversimplify the task, focusing on initial query parsing while
failing to robustly manage data complexity, code errors, or final visualization
quality. In this paper, we reframe this challenge as a collaborative
multi-agent problem. We introduce CoDA, a multi-agent system that employs
specialized LLM agents for metadata analysis, task planning, code generation,
and self-reflection. We formalize this pipeline, demonstrating how
metadata-focused analysis bypasses token limits and quality-driven refinement
ensures robustness. Extensive evaluations show CoDA achieves substantial gains
in the overall score, outperforming competitive baselines by up to 41.5%. This
work demonstrates that the future of visualization automation lies not in
isolated code generation but in integrated, collaborative agentic workflows.