ChartVerse: Scalabilità del Ragionamento sui Grafici tramite Sintesi Programmabile Affidabile da Zero

Abstract

Il ragionamento sui grafici è una capacità critica per i modelli linguistici visivi (VLM). Tuttavia, lo sviluppo di modelli open-source è gravemente ostacolato dalla mancanza di dati di addestramento di alta qualità. I dataset esistenti presentano una duplice sfida: i grafici sintetici sono spesso semplicistici e ripetitivi, mentre le coppie domanda-risposta associate sono soggette a allucinazioni e mancano della profondità di ragionamento necessaria per compiti complessi. Per colmare questa lacuna, proponiamo ChartVerse, un framework scalabile progettato per sintetizzare grafici complessi e dati di ragionamento affidabili da zero. (1) Per affrontare il collo di bottiglia degli schemi semplici, introduciamo innanzitutto l'Entropia Posteriore di Rollout (RPE), una nuova metrica che quantifica la complessità del grafico. Guidati da RPE, sviluppiamo un chart coder consapevole della complessità per sintetizzare autonomamente grafici diversificati e ad alta complessità tramite programmi eseguibili. (2) Per garantire il rigore del ragionamento, sviluppiamo una sintesi inversa di QA ancorata alla verità. Diversamente dalla generazione standard, adottiamo un paradigma answer-first: estraiamo risposte deterministiche direttamente dal codice sorgente, generiamo domande condizionate a questi ancoraggi e applichiamo una verifica di coerenza rigorosa. Per aumentare ulteriormente la difficoltà e la profondità di ragionamento, filtriamo i campioni in base al tasso di fallimento del modello e distilliamo ragionamenti a catena del pensiero (CoT) di alta qualità. Abbiamo curato ChartVerse-SFT-600K e ChartVerse-RL-40K utilizzando Qwen3-VL-30B-A3B-Thinking come insegnante. I risultati sperimentali dimostrano che ChartVerse-8B raggiunge prestazioni all'avanguardia, superando notevolmente il suo insegnante e competendo con il più potente Qwen3-VL-32B-Thinking.

English

Chart reasoning is a critical capability for Vision Language Models (VLMs). However, the development of open-source models is severely hindered by the lack of high-quality training data. Existing datasets suffer from a dual challenge: synthetic charts are often simplistic and repetitive, while the associated QA pairs are prone to hallucinations and lack the reasoning depth required for complex tasks. To bridge this gap, we propose ChartVerse, a scalable framework designed to synthesize complex charts and reliable reasoning data from scratch. (1) To address the bottleneck of simple patterns, we first introduce Rollout Posterior Entropy (RPE), a novel metric that quantifies chart complexity. Guided by RPE, we develop complexity-aware chart coder to autonomously synthesize diverse, high-complexity charts via executable programs. (2) To guarantee reasoning rigor, we develop truth-anchored inverse QA synthesis. Diverging from standard generation, we adopt an answer-first paradigm: we extract deterministic answers directly from the source code, generate questions conditional on these anchors, and enforce strict consistency verification. To further elevate difficulty and reasoning depth, we filter samples based on model fail-rate and distill high-quality Chain-of-Thought (CoT) reasoning. We curate ChartVerse-SFT-600K and ChartVerse-RL-40K using Qwen3-VL-30B-A3B-Thinking as the teacher. Experimental results demonstrate that ChartVerse-8B achieves state-of-the-art performance, notably surpassing its teacher and rivaling the stronger Qwen3-VL-32B-Thinking.

ChartVerse: Scalabilità del Ragionamento sui Grafici tramite Sintesi Programmabile Affidabile da Zero

ChartVerse: Scaling Chart Reasoning via Reliable Programmatic Synthesis from Scratch

Abstract

Support