CoDA: Sistemas Agentes para la Visualización Colaborativa de Datos
CoDA: Agentic Systems for Collaborative Data Visualization
October 3, 2025
Autores: Zichen Chen, Jiefeng Chen, Sercan Ö. Arik, Misha Sra, Tomas Pfister, Jinsung Yoon
cs.AI
Resumen
La investigación profunda ha revolucionado el análisis de datos, pero los científicos de datos aún dedican un tiempo considerable a la creación manual de visualizaciones, lo que resalta la necesidad de una automatización robusta a partir de consultas en lenguaje natural. Sin embargo, los sistemas actuales enfrentan dificultades con conjuntos de datos complejos que contienen múltiples archivos y refinamientos iterativos. Los enfoques existentes, incluyendo sistemas simples de uno o varios agentes, a menudo simplifican demasiado la tarea, centrándose en el análisis inicial de la consulta mientras no logran gestionar de manera robusta la complejidad de los datos, los errores en el código o la calidad final de la visualización. En este artículo, replanteamos este desafío como un problema colaborativo de múltiples agentes. Presentamos CoDA, un sistema multiagente que emplea agentes especializados de LLM para el análisis de metadatos, la planificación de tareas, la generación de código y la autorreflexión. Formalizamos esta canalización, demostrando cómo el análisis centrado en metadatos supera los límites de tokens y el refinamiento orientado a la calidad garantiza la robustez. Evaluaciones exhaustivas muestran que CoDA logra mejoras significativas en la puntuación general, superando a los baselines competitivos hasta en un 41.5%. Este trabajo demuestra que el futuro de la automatización de visualizaciones no reside en la generación aislada de código, sino en flujos de trabajo integrados y colaborativos de agentes.
English
Deep research has revolutionized data analysis, yet data scientists still
devote substantial time to manually crafting visualizations, highlighting the
need for robust automation from natural language queries. However, current
systems struggle with complex datasets containing multiple files and iterative
refinement. Existing approaches, including simple single- or multi-agent
systems, often oversimplify the task, focusing on initial query parsing while
failing to robustly manage data complexity, code errors, or final visualization
quality. In this paper, we reframe this challenge as a collaborative
multi-agent problem. We introduce CoDA, a multi-agent system that employs
specialized LLM agents for metadata analysis, task planning, code generation,
and self-reflection. We formalize this pipeline, demonstrating how
metadata-focused analysis bypasses token limits and quality-driven refinement
ensures robustness. Extensive evaluations show CoDA achieves substantial gains
in the overall score, outperforming competitive baselines by up to 41.5%. This
work demonstrates that the future of visualization automation lies not in
isolated code generation but in integrated, collaborative agentic workflows.