ChatPaper.aiChatPaper

CoDA: Агентные системы для совместной визуализации данных

CoDA: Agentic Systems for Collaborative Data Visualization

October 3, 2025
Авторы: Zichen Chen, Jiefeng Chen, Sercan Ö. Arik, Misha Sra, Tomas Pfister, Jinsung Yoon
cs.AI

Аннотация

Глубокие исследования революционизировали анализ данных, однако специалисты по данным по-прежнему тратят значительное время на ручное создание визуализаций, что подчеркивает необходимость надежной автоматизации на основе запросов на естественном языке. Тем не менее, современные системы сталкиваются с трудностями при работе со сложными наборами данных, содержащими несколько файлов и требующими итеративного уточнения. Существующие подходы, включая простые одно- или многоагентные системы, часто упрощают задачу, сосредотачиваясь на начальном разборе запросов, но не справляются с управлением сложностью данных, ошибками в коде или качеством итоговой визуализации. В данной статье мы переосмысливаем эту задачу как проблему совместной работы множества агентов. Мы представляем CoDA, многоагентную систему, которая использует специализированные LLM-агенты для анализа метаданных, планирования задач, генерации кода и саморефлексии. Мы формализуем этот процесс, демонстрируя, как анализ, ориентированный на метаданные, позволяет обойти ограничения на количество токенов, а качественно-ориентированное уточнение обеспечивает надежность. Обширные оценки показывают, что CoDA достигает значительного улучшения общего показателя, превосходя конкурентоспособные базовые подходы на величину до 41,5%. Эта работа демонстрирует, что будущее автоматизации визуализации заключается не в изолированной генерации кода, а в интегрированных, совместных агентных процессах.
English
Deep research has revolutionized data analysis, yet data scientists still devote substantial time to manually crafting visualizations, highlighting the need for robust automation from natural language queries. However, current systems struggle with complex datasets containing multiple files and iterative refinement. Existing approaches, including simple single- or multi-agent systems, often oversimplify the task, focusing on initial query parsing while failing to robustly manage data complexity, code errors, or final visualization quality. In this paper, we reframe this challenge as a collaborative multi-agent problem. We introduce CoDA, a multi-agent system that employs specialized LLM agents for metadata analysis, task planning, code generation, and self-reflection. We formalize this pipeline, demonstrating how metadata-focused analysis bypasses token limits and quality-driven refinement ensures robustness. Extensive evaluations show CoDA achieves substantial gains in the overall score, outperforming competitive baselines by up to 41.5%. This work demonstrates that the future of visualization automation lies not in isolated code generation but in integrated, collaborative agentic workflows.
PDF273October 6, 2025