ChatPaper.aiChatPaper

CoDA: Sistemas Autônomos para Visualização Colaborativa de Dados

CoDA: Agentic Systems for Collaborative Data Visualization

October 3, 2025
Autores: Zichen Chen, Jiefeng Chen, Sercan Ö. Arik, Misha Sra, Tomas Pfister, Jinsung Yoon
cs.AI

Resumo

A pesquisa profunda revolucionou a análise de dados, mas os cientistas de dados ainda dedicam um tempo considerável à criação manual de visualizações, destacando a necessidade de uma automação robusta a partir de consultas em linguagem natural. No entanto, os sistemas atuais enfrentam dificuldades com conjuntos de dados complexos que contêm múltiplos arquivos e refinamentos iterativos. As abordagens existentes, incluindo sistemas simples de agente único ou multiagente, frequentemente simplificam demais a tarefa, focando na análise inicial da consulta enquanto falham em gerenciar de forma robusta a complexidade dos dados, erros de código ou a qualidade final da visualização. Neste artigo, reformulamos esse desafio como um problema colaborativo multiagente. Introduzimos o CoDA, um sistema multiagente que emprega agentes de LLM especializados para análise de metadados, planejamento de tarefas, geração de código e autorreflexão. Formalizamos esse pipeline, demonstrando como a análise focada em metadados contorna os limites de tokens e o refinamento orientado pela qualidade garante robustez. Avaliações extensivas mostram que o CoDA alcança ganhos substanciais na pontuação geral, superando as linhas de base competitivas em até 41,5%. Este trabalho demonstra que o futuro da automação de visualizações não está na geração isolada de código, mas em fluxos de trabalho agentivos integrados e colaborativos.
English
Deep research has revolutionized data analysis, yet data scientists still devote substantial time to manually crafting visualizations, highlighting the need for robust automation from natural language queries. However, current systems struggle with complex datasets containing multiple files and iterative refinement. Existing approaches, including simple single- or multi-agent systems, often oversimplify the task, focusing on initial query parsing while failing to robustly manage data complexity, code errors, or final visualization quality. In this paper, we reframe this challenge as a collaborative multi-agent problem. We introduce CoDA, a multi-agent system that employs specialized LLM agents for metadata analysis, task planning, code generation, and self-reflection. We formalize this pipeline, demonstrating how metadata-focused analysis bypasses token limits and quality-driven refinement ensures robustness. Extensive evaluations show CoDA achieves substantial gains in the overall score, outperforming competitive baselines by up to 41.5%. This work demonstrates that the future of visualization automation lies not in isolated code generation but in integrated, collaborative agentic workflows.
PDF283October 6, 2025