Агент дата-журналистики: Преобразование данных в проверяемые мультимодальные истории
Data Journalist Agent: Transforming Data into Verifiable Multimodal Stories
June 9, 2026
Авторы: Kevin Qinghong Lin, Batu EI, Yuhong Shi, Pan Lu, Philip Torr, James Zou
cs.AI
Аннотация
Данные рассказывают истории, формирующие общество; задача журналиста данных — превращать сырую информацию в истории, которым могут доверять неспециалисты. Создание качественного новостного материала занимает у редакционной команды недели: поиск контекста, проведение статистического анализа, выбор угла подачи и разработка визуализаций. Современные агенты хорошо справляются с отдельными этапами: агенты в области науки о данных замыкают цикл анализа, а агенты дизайна синтезируют красивые веб-сайты. Но может ли агент выступать в роли журналиста данных от начала до конца? Мы представляем Агента журналистики данных (Data2Story) — мультиагентный фреймворк, который координирует специализированные роли в единой виртуальной редакции. Data2Story предлагает два новшества. (i) Утверждения обоснованы доказательствами: Инспектор связывает каждое число, угол подачи и актив с данными, кодом или внешним источником. (ii) Статьи мультимодально генерируются: вместо того чтобы по умолчанию использовать простой текст и статические графики, Data2Story рассуждает о том, что читатели захотят увидеть, а затем применяет мультимодальные инструменты, такие как интерактивные карты для географии и аудио для музыки. Мы оцениваем Data2Story на 18 статьях, каждая из которых сопоставлена с изначально опубликованной экспертной работой, по четырём направлениям: (a) охват углов подачи человеком и агентом; (b) оценка по рубрикам с 53 участниками по пяти измерениям; (c) агенты, имитирующие поведение пользователей, в качестве судей — экономичная замена реальному взаимодействию читателей с интерактивными статьями; и (d) проверяемость, где проверяющий код повторно выполняет утверждения на основе данных и сверяет утверждения с источниками. Data2Story создаёт конкурентоспособные, поддающиеся проверке доказательств мультимедийные истории, с особым преимуществом в прозрачности и возможности аудита. Человеческие статьи сохраняют преимущество в редакторском угле, креативном дизайне и презентации. Мы позиционируем Data2Story как инструмент сотрудничества для журналистов, обеспечивающий более обоснованную с точки зрения доказательств, прозрачную и проверяемую отчётность. Код и демонстрации доступны по адресу https://data2story.github.io.
English
Data tells stories that shape society; the data journalist's job is to turn raw information into stories non-experts can trust. A high-quality news feature takes a newsroom team weeks: hunting for context, running statistics, choosing an angle, and designing visuals. Recent agents handle individual steps well: data-science agents close the analysis loop, while design agents synthesize beautiful websites. But can an agent serve as a data journalist end to end? We introduce Data Journalist Agent (Data2Story), a multi-agent framework that orchestrates specialized roles into a single virtual newsroom. Data2Story contributes two innovations. (i) Claims are evidence-grounded: an Inspector links every number, angle, and asset back to data, code, or an external reference. (ii) Articles are multimodally generative: rather than defaulting to plain text and static charts, Data2Story reasons about what readers will want to see, then deploys multimodal tools, such as interactive maps for geography and audio for music. We evaluate Data2Story on 18 articles, each paired with the originally published expert piece, along four axes: (a) human-agent angle coverage; (b) rubric evaluation with 53 participants across five dimensions; (c) computer-use agents as judges, a cost-saving proxy for how readers navigate interactive articles; and (d) verifiability, where a coding verifier re-executes statements against the data and checks claims against references. Data2Story produces competitive, evidence-traceable multimedia stories, with particular strength in transparency and auditability. Human articles retain an edge in editorial angle, creative design, and presentation. We position Data2Story as a collaborator for journalists, enabling more evidence-based, transparent, and verifiable reporting. Code and demos are available at https://data2story.github.io.