ChartVerse: Schaalvergroting van Grafiekredenering via Betrouwbare Programmatische Synthese vanaf Nul

Samenvatting

Grafiekredenering is een cruciale vaardigheid voor Vision Language Models (VLM's). De ontwikkeling van open-source modellen wordt echter ernstig belemmerd door een gebrek aan hoogwaardige trainingsdata. Bestaande datasets kampen met een dubbele uitdaging: synthetische grafieken zijn vaak simplistisch en repetitief, terwijl de bijbehorende vraag-antwoordparen gevoelig zijn voor hallucinaties en het ontbreekt ze aan de redeneerdiepte die nodig is voor complexe taken. Om deze kloof te overbruggen, stellen we ChartVerse voor, een schaalbaar framework ontworpen om complexe grafieken en betrouwbare redeneerdata vanaf nul te synthetiseren. (1) Om het knelpunt van eenvoudige patronen aan te pakken, introduceren we eerst Rollout Posterior Entropy (RPE), een nieuwe maatstaf die de complexiteit van een grafiek kwantificeert. Geleid door RPE ontwikkelen we een complexiteitsbewuste grafiekcoder om autonoom diverse, hoogcomplexe grafieken te synthetiseren via uitvoerbare programma's. (2) Om de redeneerrigeur te garanderen, ontwikkelen we een waarheid-verankerde inverse QA-synthese. In tegenstelling tot standaardgeneratie hanteren we een antwoord-eerst paradigma: we extraheren deterministische antwoorden rechtstreeks uit de broncode, genereren vragen conditioneel op deze ankers en voeren strikte consistentieverificatie af. Om de moeilijkheidsgraad en redeneerdiepte verder te verhogen, filteren we samples op basis van model-faalkans en destilleren we hoogwaardige Chain-of-Thought (CoT)-redenering. We hebben ChartVerse-SFT-600K en ChartVerse-RL-40K samengesteld met Qwen3-VL-30B-A3B-Thinking als de leraar. Experimentele resultaten tonen aan dat ChartVerse-8B state-of-the-art prestaties bereikt, waarbij het opvallend genoeg zijn leraar overtreft en kan wedijveren met de sterkere Qwen3-VL-32B-Thinking.

English

Chart reasoning is a critical capability for Vision Language Models (VLMs). However, the development of open-source models is severely hindered by the lack of high-quality training data. Existing datasets suffer from a dual challenge: synthetic charts are often simplistic and repetitive, while the associated QA pairs are prone to hallucinations and lack the reasoning depth required for complex tasks. To bridge this gap, we propose ChartVerse, a scalable framework designed to synthesize complex charts and reliable reasoning data from scratch. (1) To address the bottleneck of simple patterns, we first introduce Rollout Posterior Entropy (RPE), a novel metric that quantifies chart complexity. Guided by RPE, we develop complexity-aware chart coder to autonomously synthesize diverse, high-complexity charts via executable programs. (2) To guarantee reasoning rigor, we develop truth-anchored inverse QA synthesis. Diverging from standard generation, we adopt an answer-first paradigm: we extract deterministic answers directly from the source code, generate questions conditional on these anchors, and enforce strict consistency verification. To further elevate difficulty and reasoning depth, we filter samples based on model fail-rate and distill high-quality Chain-of-Thought (CoT) reasoning. We curate ChartVerse-SFT-600K and ChartVerse-RL-40K using Qwen3-VL-30B-A3B-Thinking as the teacher. Experimental results demonstrate that ChartVerse-8B achieves state-of-the-art performance, notably surpassing its teacher and rivaling the stronger Qwen3-VL-32B-Thinking.

ChartVerse: Schaalvergroting van Grafiekredenering via Betrouwbare Programmatische Synthese vanaf Nul

ChartVerse: Scaling Chart Reasoning via Reliable Programmatic Synthesis from Scratch

Samenvatting

Support