AutoFigure: Erstellung und Verfeinerung von publikationsreifen wissenschaftlichen Abbildungen
AutoFigure: Generating and Refining Publication-Ready Scientific Illustrations
February 3, 2026
papers.authors: Minjun Zhu, Zhen Lin, Yixuan Weng, Panzhong Lu, Qiujie Xie, Yifan Wei, Sifan Liu, Qiyao Sun, Yue Zhang
cs.AI
papers.abstract
Hochwertige wissenschaftliche Illustrationen sind entscheidend für die effektive Vermittlung komplexer wissenschaftlicher und technischer Konzepte, doch ihre manuelle Erstellung bleibt sowohl in der Wissenschaft als auch in der Industrie ein allgemein anerkannter Engpass. Wir stellen FigureBench vor, den ersten umfassenden Benchmark zur Erzeugung wissenschaftlicher Illustrationen aus langen wissenschaftlichen Texten. Er enthält 3.300 hochwertige wissenschaftliche Text-Bild-Paare, die verschiedene Text-zu-Illustration-Aufgaben aus wissenschaftlichen Artikeln, Übersichtsarbeiten, Blogs und Lehrbüchern abdecken. Darüber hinaus präsentieren wir AutoFigure, das erste agentenbasierte Framework, das automatisch hochwertige wissenschaftliche Illustrationen auf der Grundlage langer wissenschaftlicher Texte erzeugt. Konkret führt AutoFigure vor dem Rendern des Endergebnisses umfangreiche Denk-, Rekombinations- und Validierungsprozesse durch, um ein Layout zu erstellen, das sowohl strukturell fundiert als auch ästhetisch anspruchsvoll ist, und erzeugt so eine wissenschaftliche Illustration, die strukturelle Vollständigkeit und ästhetische Anziehungskraft vereint. Unter Nutzung der hochwertigen Daten von FigureBench führen wir umfangreiche Experimente durch, um die Leistung von AutoFigure mit verschiedenen Baseline-Methoden zu vergleichen. Die Ergebnisse zeigen, dass AutoFigure durchgängig alle Baseline-Methoden übertrifft und direkt publizierbare wissenschaftliche Illustrationen erzeugt. Der Code, der Datensatz und der Huggingface-Space sind unter https://github.com/ResearAI/AutoFigure veröffentlicht.
English
High-quality scientific illustrations are crucial for effectively communicating complex scientific and technical concepts, yet their manual creation remains a well-recognized bottleneck in both academia and industry. We present FigureBench, the first large-scale benchmark for generating scientific illustrations from long-form scientific texts. It contains 3,300 high-quality scientific text-figure pairs, covering diverse text-to-illustration tasks from scientific papers, surveys, blogs, and textbooks. Moreover, we propose AutoFigure, the first agentic framework that automatically generates high-quality scientific illustrations based on long-form scientific text. Specifically, before rendering the final result, AutoFigure engages in extensive thinking, recombination, and validation to produce a layout that is both structurally sound and aesthetically refined, outputting a scientific illustration that achieves both structural completeness and aesthetic appeal. Leveraging the high-quality data from FigureBench, we conduct extensive experiments to test the performance of AutoFigure against various baseline methods. The results demonstrate that AutoFigure consistently surpasses all baseline methods, producing publication-ready scientific illustrations. The code, dataset and huggingface space are released in https://github.com/ResearAI/AutoFigure.