CoDA: Sistemas Agentes para la Visualización Colaborativa de Datos

Resumen

La investigación profunda ha revolucionado el análisis de datos, pero los científicos de datos aún dedican un tiempo considerable a la creación manual de visualizaciones, lo que resalta la necesidad de una automatización robusta a partir de consultas en lenguaje natural. Sin embargo, los sistemas actuales enfrentan dificultades con conjuntos de datos complejos que contienen múltiples archivos y refinamientos iterativos. Los enfoques existentes, incluyendo sistemas simples de uno o varios agentes, a menudo simplifican demasiado la tarea, centrándose en el análisis inicial de la consulta mientras no logran gestionar de manera robusta la complejidad de los datos, los errores en el código o la calidad final de la visualización. En este artículo, replanteamos este desafío como un problema colaborativo de múltiples agentes. Presentamos CoDA, un sistema multiagente que emplea agentes especializados de LLM para el análisis de metadatos, la planificación de tareas, la generación de código y la autorreflexión. Formalizamos esta canalización, demostrando cómo el análisis centrado en metadatos supera los límites de tokens y el refinamiento orientado a la calidad garantiza la robustez. Evaluaciones exhaustivas muestran que CoDA logra mejoras significativas en la puntuación general, superando a los baselines competitivos hasta en un 41.5%. Este trabajo demuestra que el futuro de la automatización de visualizaciones no reside en la generación aislada de código, sino en flujos de trabajo integrados y colaborativos de agentes.

English

Deep research has revolutionized data analysis, yet data scientists still devote substantial time to manually crafting visualizations, highlighting the need for robust automation from natural language queries. However, current systems struggle with complex datasets containing multiple files and iterative refinement. Existing approaches, including simple single- or multi-agent systems, often oversimplify the task, focusing on initial query parsing while failing to robustly manage data complexity, code errors, or final visualization quality. In this paper, we reframe this challenge as a collaborative multi-agent problem. We introduce CoDA, a multi-agent system that employs specialized LLM agents for metadata analysis, task planning, code generation, and self-reflection. We formalize this pipeline, demonstrating how metadata-focused analysis bypasses token limits and quality-driven refinement ensures robustness. Extensive evaluations show CoDA achieves substantial gains in the overall score, outperforming competitive baselines by up to 41.5%. This work demonstrates that the future of visualization automation lies not in isolated code generation but in integrated, collaborative agentic workflows.

CoDA: Sistemas Agentes para la Visualización Colaborativa de Datos

CoDA: Agentic Systems for Collaborative Data Visualization

Resumen

Support