CoDA: Sistemi Agenti per la Visualizzazione Collaborativa dei Dati
CoDA: Agentic Systems for Collaborative Data Visualization
October 3, 2025
Autori: Zichen Chen, Jiefeng Chen, Sercan Ö. Arik, Misha Sra, Tomas Pfister, Jinsung Yoon
cs.AI
Abstract
La ricerca avanzata ha rivoluzionato l'analisi dei dati, eppure gli scienziati dei dati dedicano ancora un tempo considerevole alla creazione manuale di visualizzazioni, evidenziando la necessità di una robusta automazione a partire da query in linguaggio naturale. Tuttavia, i sistemi attuali faticano a gestire dataset complessi contenenti più file e raffinamenti iterativi. Gli approcci esistenti, inclusi semplici sistemi mono- o multi-agente, spesso semplificano eccessivamente il compito, concentrandosi sull'analisi iniziale della query mentre non riescono a gestire in modo robusto la complessità dei dati, gli errori nel codice o la qualità finale della visualizzazione. In questo articolo, riformuliamo questa sfida come un problema collaborativo multi-agente. Introduciamo CoDA, un sistema multi-agente che utilizza agenti LLM specializzati per l'analisi dei metadati, la pianificazione delle attività, la generazione del codice e l'autoriflessione. Formalizziamo questa pipeline, dimostrando come un'analisi focalizzata sui metadati superi i limiti di token e come un raffinamento guidato dalla qualità garantisca robustezza. Valutazioni estensive mostrano che CoDA ottiene miglioramenti significativi nel punteggio complessivo, superando i benchmark competitivi fino al 41,5%. Questo lavoro dimostra che il futuro dell'automazione delle visualizzazioni non risiede nella generazione isolata di codice, ma in flussi di lavoro integrati e collaborativi basati su agenti.
English
Deep research has revolutionized data analysis, yet data scientists still
devote substantial time to manually crafting visualizations, highlighting the
need for robust automation from natural language queries. However, current
systems struggle with complex datasets containing multiple files and iterative
refinement. Existing approaches, including simple single- or multi-agent
systems, often oversimplify the task, focusing on initial query parsing while
failing to robustly manage data complexity, code errors, or final visualization
quality. In this paper, we reframe this challenge as a collaborative
multi-agent problem. We introduce CoDA, a multi-agent system that employs
specialized LLM agents for metadata analysis, task planning, code generation,
and self-reflection. We formalize this pipeline, demonstrating how
metadata-focused analysis bypasses token limits and quality-driven refinement
ensures robustness. Extensive evaluations show CoDA achieves substantial gains
in the overall score, outperforming competitive baselines by up to 41.5%. This
work demonstrates that the future of visualization automation lies not in
isolated code generation but in integrated, collaborative agentic workflows.