데이터 저널리스트 에이전트: 데이터를 검증 가능한 멀티모달 스토리로 변환
Data Journalist Agent: Transforming Data into Verifiable Multimodal Stories
June 9, 2026
저자: Kevin Qinghong Lin, Batu EI, Yuhong Shi, Pan Lu, Philip Torr, James Zou
cs.AI
초록
데이터는 사회를 형성하는 이야기를 전합니다. 데이터 저널리스트의 임무는 원시 정보를 비전문가도 신뢰할 수 있는 이야기로 전환하는 것입니다. 고품질의 뉴스 특집은 뉴스룸 팀이 몇 주에 걸쳐 맥락을 찾고, 통계를 실행하고, 각도를 선택하고, 시각 자료를 디자인해야 합니다. 최근 에이전트들은 개별 단계를 잘 처리합니다. 데이터 과학 에이전트는 분석 루프를 완성하고, 디자인 에이전트는 아름다운 웹사이트를 종합합니다. 하지만 에이전트가 종단 간 데이터 저널리스트 역할을 할 수 있을까요? 우리는 데이터 저널리스트 에이전트(Data2Story)를 소개합니다. 이는 전문 역할들을 하나의 가상 뉴스룸으로 조율하는 다중 에이전트 프레임워크입니다. Data2Story는 두 가지 혁신을 제공합니다. (i) 주장은 증거에 기반합니다. 검사관(Inspector)은 모든 숫자, 각도, 자산을 데이터, 코드 또는 외부 참고 자료로 다시 연결합니다. (ii) 기사는 다중 모드로 생성됩니다. Data2Story는 기본 텍스트와 정적 차트 대신 독자가 보고 싶어 할 것을 추론한 후, 지리에는 대화형 지도, 음악에는 오디오와 같은 다중 모드 도구를 배치합니다. 우리는 Data2Story를 18개의 기사로 평가했으며, 각 기사는 원래 출판된 전문가 버전과 짝을 이루었습니다. 평가는 네 가지 축을 따라 진행되었습니다: (a) 인간-에이전트 관점 커버리지; (b) 5개 차원에 걸쳐 53명의 참가자를 대상으로 한 루브릭 평가; (c) 독자가 대화형 기사를 탐색하는 방식을 대체하는 비용 절감 대리자로서의 컴퓨터 사용 에이전트 판정; (d) 검증 가능성, 여기서 코딩 검증자는 데이터에 대한 진술을 재실행하고 참고 자료에 대한 주장을 확인합니다. Data2Story는 경쟁력 있고 증거 추적이 가능한 멀티미디어 스토리를 생성하며, 특히 투명성과 감사 가능성에서 강점을 보입니다. 인간 기사는 편집 관점, 창의적 디자인 및 프레젠테이션에서 여전히 우위를 유지합니다. 우리는 Data2Story를 저널리스트를 위한 협력자로 자리매김하며, 더욱 증거 기반이고 투명하며 검증 가능한 보도를 가능하게 합니다. 코드와 데모는 https://data2story.github.io에서 확인할 수 있습니다.
English
Data tells stories that shape society; the data journalist's job is to turn raw information into stories non-experts can trust. A high-quality news feature takes a newsroom team weeks: hunting for context, running statistics, choosing an angle, and designing visuals. Recent agents handle individual steps well: data-science agents close the analysis loop, while design agents synthesize beautiful websites. But can an agent serve as a data journalist end to end? We introduce Data Journalist Agent (Data2Story), a multi-agent framework that orchestrates specialized roles into a single virtual newsroom. Data2Story contributes two innovations. (i) Claims are evidence-grounded: an Inspector links every number, angle, and asset back to data, code, or an external reference. (ii) Articles are multimodally generative: rather than defaulting to plain text and static charts, Data2Story reasons about what readers will want to see, then deploys multimodal tools, such as interactive maps for geography and audio for music. We evaluate Data2Story on 18 articles, each paired with the originally published expert piece, along four axes: (a) human-agent angle coverage; (b) rubric evaluation with 53 participants across five dimensions; (c) computer-use agents as judges, a cost-saving proxy for how readers navigate interactive articles; and (d) verifiability, where a coding verifier re-executes statements against the data and checks claims against references. Data2Story produces competitive, evidence-traceable multimedia stories, with particular strength in transparency and auditability. Human articles retain an edge in editorial angle, creative design, and presentation. We position Data2Story as a collaborator for journalists, enabling more evidence-based, transparent, and verifiable reporting. Code and demos are available at https://data2story.github.io.