ChatPaper.aiChatPaper

ChartVerse: Escalando el razonamiento de gráficos mediante síntesis programática confiable desde cero

ChartVerse: Scaling Chart Reasoning via Reliable Programmatic Synthesis from Scratch

January 20, 2026
Autores: Zheng Liu, Honglin Lin, Chonghan Qin, Xiaoyang Wang, Xin Gao, Yu Li, Mengzhang Cai, Yun Zhu, Zhanping Zhong, Qizhi Pei, Zhuoshi Pan, Xiaoran Shang, Bin Cui, Conghui He, Wentao Zhang, Lijun Wu
cs.AI

Resumen

El razonamiento sobre gráficos es una capacidad crítica para los Modelos de Lenguaje Visual (VLMs). Sin embargo, el desarrollo de modelos de código abierto se ve severamente obstaculizado por la falta de datos de entrenamiento de alta calidad. Los conjuntos de datos existentes adolecen de un doble desafío: los gráficos sintéticos suelen ser simplistas y repetitivos, mientras que los pares de preguntas y respuestas asociados son propensos a alucinaciones y carecen de la profundidad de razonamiento necesaria para tareas complejas. Para salvar esta brecha, proponemos ChartVerse, un marco escalable diseñado para sintetizar gráficos complejos y datos de razonamiento confiables desde cero. (1) Para abordar el cuello de botella de los patrones simples, primero introducimos la Entropía Posterior de Despliegue (RPE), una métrica novedosa que cuantifica la complejidad de los gráficos. Guiados por la RPE, desarrollamos un codificador de gráficos consciente de la complejidad para sintetizar de forma autónoma gráficos diversos y de alta complejidad mediante programas ejecutables. (2) Para garantizar el rigor del razonamiento, desarrollamos una síntesis inversa de preguntas y respuestas anclada en la verdad. A diferencia de la generación estándar, adoptamos un paradigma de respuesta-primero: extraemos respuestas determinísticas directamente del código fuente, generamos preguntas condicionadas a estos anclajes y aplicamos una verificación de consistencia estricta. Para elevar aún más la dificultad y la profundidad del razonamiento, filtramos muestras basándonos en la tasa de error del modelo y destilamos un razonamiento de Cadena de Pensamiento (CoT) de alta calidad. Curaremos ChartVerse-SFT-600K y ChartVerse-RL-40K utilizando Qwen3-VL-30B-A3B-Thinking como modelo profesor. Los resultados experimentales demuestran que ChartVerse-8B logra un rendimiento de vanguardia, superando notablemente a su modelo profesor y rivalizando con el más potente Qwen3-VL-32B-Thinking.
English
Chart reasoning is a critical capability for Vision Language Models (VLMs). However, the development of open-source models is severely hindered by the lack of high-quality training data. Existing datasets suffer from a dual challenge: synthetic charts are often simplistic and repetitive, while the associated QA pairs are prone to hallucinations and lack the reasoning depth required for complex tasks. To bridge this gap, we propose ChartVerse, a scalable framework designed to synthesize complex charts and reliable reasoning data from scratch. (1) To address the bottleneck of simple patterns, we first introduce Rollout Posterior Entropy (RPE), a novel metric that quantifies chart complexity. Guided by RPE, we develop complexity-aware chart coder to autonomously synthesize diverse, high-complexity charts via executable programs. (2) To guarantee reasoning rigor, we develop truth-anchored inverse QA synthesis. Diverging from standard generation, we adopt an answer-first paradigm: we extract deterministic answers directly from the source code, generate questions conditional on these anchors, and enforce strict consistency verification. To further elevate difficulty and reasoning depth, we filter samples based on model fail-rate and distill high-quality Chain-of-Thought (CoT) reasoning. We curate ChartVerse-SFT-600K and ChartVerse-RL-40K using Qwen3-VL-30B-A3B-Thinking as the teacher. Experimental results demonstrate that ChartVerse-8B achieves state-of-the-art performance, notably surpassing its teacher and rivaling the stronger Qwen3-VL-32B-Thinking.
PDF62January 27, 2026