ChatPaper.aiChatPaper

ChartVerse: 신뢰할 수 있는 프로그램적 합성을 통한 차트 추론 확장

ChartVerse: Scaling Chart Reasoning via Reliable Programmatic Synthesis from Scratch

January 20, 2026
저자: Zheng Liu, Honglin Lin, Chonghan Qin, Xiaoyang Wang, Xin Gao, Yu Li, Mengzhang Cai, Yun Zhu, Zhanping Zhong, Qizhi Pei, Zhuoshi Pan, Xiaoran Shang, Bin Cui, Conghui He, Wentao Zhang, Lijun Wu
cs.AI

초록

차트 추론은 비전 언어 모델(VLM)의 핵심 능력입니다. 그러나 고품질 학습 데이터의 부족으로 오픈소스 모델 개발이 심각하게 저해되고 있습니다. 기존 데이터셋은 이중적인 과제를 안고 있습니다: 합성 차트는 단순하고 반복적인 경향이 있는 반면, 연관된 질의응답(QA) 쌍은 환각(hallucination)이 발생하기 쉬우며 복잡한 작업에 필요한 추론 깊이가 부족합니다. 이러한 격차를 해소하기 위해 우리는 복잡한 차트와 신뢰할 수 있는 추론 데이터를 처음부터 합성하기 위한 확장 가능한 프레임워크인 ChartVerse를 제안합니다. (1) 단순 패턴의 병목 현상을 해결하기 위해, 우리는 먼저 차트 복잡성을 정량화하는 새로운 지표인 Rollout Posterior Entropy(RPE)를 소개합니다. RPE의 지도를 받아 우리는 실행 가능한 프로그램을 통해 다양하고 고복잡도의 차트를 자율적으로 합성하는 복잡성 인식 차트 코더를 개발합니다. (2) 추론의 엄밀성을 보장하기 위해, 우리는 진실 값에 기반한 역방향 QA 합성 방법을 개발합니다. 표준 생성 방식과 달리, 우리는 답변을 먼저 생성하는 패러다임을 채택합니다: 소스 코드에서 결정론적 답변을 직접 추출하고, 이러한 기준점에 조건을 두어 질문을 생성하며, 엄격한 일관성 검증을 적용합니다. 난이도와 추론 깊이를 더욱 높이기 위해, 우리는 모델 실패율을 기준으로 샘플을 필터링하고 고품질의 사고 연쇄(CoT) 추론 데이터를 정제합니다. 우리는 Qwen3-VL-30B-A3B-Thinking을 교사 모델로 사용하여 ChartVerse-SFT-600K와 ChartVerse-RL-40K 데이터셋을 구축했습니다. 실험 결과, ChartVerse-8B 모델은 최첨단 성능을 달성하며, 특히 자신의 교사 모델을 능가하고 더 강력한 Qwen3-VL-32B-Thinking 모델에 필적하는 성과를 보여줍니다.
English
Chart reasoning is a critical capability for Vision Language Models (VLMs). However, the development of open-source models is severely hindered by the lack of high-quality training data. Existing datasets suffer from a dual challenge: synthetic charts are often simplistic and repetitive, while the associated QA pairs are prone to hallucinations and lack the reasoning depth required for complex tasks. To bridge this gap, we propose ChartVerse, a scalable framework designed to synthesize complex charts and reliable reasoning data from scratch. (1) To address the bottleneck of simple patterns, we first introduce Rollout Posterior Entropy (RPE), a novel metric that quantifies chart complexity. Guided by RPE, we develop complexity-aware chart coder to autonomously synthesize diverse, high-complexity charts via executable programs. (2) To guarantee reasoning rigor, we develop truth-anchored inverse QA synthesis. Diverging from standard generation, we adopt an answer-first paradigm: we extract deterministic answers directly from the source code, generate questions conditional on these anchors, and enforce strict consistency verification. To further elevate difficulty and reasoning depth, we filter samples based on model fail-rate and distill high-quality Chain-of-Thought (CoT) reasoning. We curate ChartVerse-SFT-600K and ChartVerse-RL-40K using Qwen3-VL-30B-A3B-Thinking as the teacher. Experimental results demonstrate that ChartVerse-8B achieves state-of-the-art performance, notably surpassing its teacher and rivaling the stronger Qwen3-VL-32B-Thinking.
PDF62January 27, 2026