ChatPaper.aiChatPaper

データジャーナリストエージェント:データを検証可能なマルチモーダルストーリーへ変換する

Data Journalist Agent: Transforming Data into Verifiable Multimodal Stories

June 9, 2026
著者: Kevin Qinghong Lin, Batu EI, Yuhong Shi, Pan Lu, Philip Torr, James Zou
cs.AI

要旨

データは社会を形作る物語を紡ぎ出す。データジャーナリストの役割は、生の情報を専門家でない人々が信頼できる物語へと変換することである。高品質なニュース特集は、ニュースルームのチームが数週間をかけて、文脈の探索、統計の実行、視点の選定、ビジュアルのデザインを行う。近年のエージェントは各工程を個別に処理することに長けている。データサイエンスエージェントは分析のループを完結させ、デザインエージェントは美しいウェブサイトを合成する。しかし、エージェントがデータジャーナリストとしてエンドツーエンドで機能できるだろうか。本稿では、Data Journalist Agent(Data2Story)を紹介する。これは、専門化された役割を単一の仮想ニュースルームに統括するマルチエージェントフレームワークである。Data2Storyは2つの革新をもたらす。(i) 主張は証拠に基づく。インスペクターがすべての数値、視点、素材をデータ、コード、または外部参照に結びつける。(ii) 記事はマルチモーダルに生成される。Data2Storyは、プレーンテキストと静的なチャートにデフォルトするのではなく、読者が何を見たがるかを推論し、対話型の地図(地理)や音声(音楽)などのマルチモーダルツールを展開する。我々はData2Storyを18の記事で評価した。各記事は元々公開された専門家の記事と対になっており、4つの軸で評価を行った。(a)人間とエージェントによる視点のカバレッジ、(b)53名の参加者による5次元のルーブリック評価、(c)コンピュータ利用エージェントを審査員として用いる評価(読者がインタラクティブ記事をどうナビゲートするかの低コストな代理指標)、(d)検証可能性(コーディング検証器がデータに対して文を再実行し、参照に対して主張をチェックする)。Data2Storyは、競争力があり証拠を追跡可能なマルチメディアストーリーを生成し、特に透明性と監査可能性に優れている。人間の書く記事は、編集の視点、創造的デザイン、プレゼンテーションにおいて依然として優位性を持つ。我々はData2Storyをジャーナリストのための協働ツールとして位置づけ、より証拠に基づき、透明で、検証可能な報道を可能にする。コードとデモはhttps://data2story.github.ioで公開されている。
English
Data tells stories that shape society; the data journalist's job is to turn raw information into stories non-experts can trust. A high-quality news feature takes a newsroom team weeks: hunting for context, running statistics, choosing an angle, and designing visuals. Recent agents handle individual steps well: data-science agents close the analysis loop, while design agents synthesize beautiful websites. But can an agent serve as a data journalist end to end? We introduce Data Journalist Agent (Data2Story), a multi-agent framework that orchestrates specialized roles into a single virtual newsroom. Data2Story contributes two innovations. (i) Claims are evidence-grounded: an Inspector links every number, angle, and asset back to data, code, or an external reference. (ii) Articles are multimodally generative: rather than defaulting to plain text and static charts, Data2Story reasons about what readers will want to see, then deploys multimodal tools, such as interactive maps for geography and audio for music. We evaluate Data2Story on 18 articles, each paired with the originally published expert piece, along four axes: (a) human-agent angle coverage; (b) rubric evaluation with 53 participants across five dimensions; (c) computer-use agents as judges, a cost-saving proxy for how readers navigate interactive articles; and (d) verifiability, where a coding verifier re-executes statements against the data and checks claims against references. Data2Story produces competitive, evidence-traceable multimedia stories, with particular strength in transparency and auditability. Human articles retain an edge in editorial angle, creative design, and presentation. We position Data2Story as a collaborator for journalists, enabling more evidence-based, transparent, and verifiable reporting. Code and demos are available at https://data2story.github.io.