AutoFigure: 出版対応可能な科学図表の生成と洗練化
AutoFigure: Generating and Refining Publication-Ready Scientific Illustrations
February 3, 2026
著者: Minjun Zhu, Zhen Lin, Yixuan Weng, Panzhong Lu, Qiujie Xie, Yifan Wei, Sifan Liu, Qiyao Sun, Yue Zhang
cs.AI
要旨
高品質な科学イラストは、複雑な科学技術概念を効果的に伝達する上で極めて重要であるが、その手作業による作成は、学界と産業界の双方で広く認識されているボトルネックである。本論文では、長文の科学テキストから科学イラストを生成するための初の大規模ベンチマークであるFigureBenchを提案する。FigureBenchは3,300組の高品質な科学テキストと図のペアを含み、学術論文、調査報告書、ブログ、教科書などにおける多様なテキストから図への変換タスクを網羅している。さらに、長文の科学テキストに基づいて高品質な科学イラストを自動生成する初のエージェント型フレームワークであるAutoFigureを提案する。具体的には、AutoFigureは最終結果をレンダリングする前に、広範な思考、再構成、検証を行い、構造的に堅牢かつ美的に洗練されたレイアウトを生成し、構造的完全性と美的魅力の両方を備えた科学イラストを出力する。FigureBenchの高品質なデータを活用し、AutoFigureの性能を様々なベースラインメソッドと比較する大規模な実験を実施した。結果は、AutoFigureが全てのベースラインメソッドを一貫して上回り、出版可能な品質の科学イラストを生成することを示している。コード、データセット、Huggingfaceスペースはhttps://github.com/ResearAI/AutoFigure で公開されている。
English
High-quality scientific illustrations are crucial for effectively communicating complex scientific and technical concepts, yet their manual creation remains a well-recognized bottleneck in both academia and industry. We present FigureBench, the first large-scale benchmark for generating scientific illustrations from long-form scientific texts. It contains 3,300 high-quality scientific text-figure pairs, covering diverse text-to-illustration tasks from scientific papers, surveys, blogs, and textbooks. Moreover, we propose AutoFigure, the first agentic framework that automatically generates high-quality scientific illustrations based on long-form scientific text. Specifically, before rendering the final result, AutoFigure engages in extensive thinking, recombination, and validation to produce a layout that is both structurally sound and aesthetically refined, outputting a scientific illustration that achieves both structural completeness and aesthetic appeal. Leveraging the high-quality data from FigureBench, we conduct extensive experiments to test the performance of AutoFigure against various baseline methods. The results demonstrate that AutoFigure consistently surpasses all baseline methods, producing publication-ready scientific illustrations. The code, dataset and huggingface space are released in https://github.com/ResearAI/AutoFigure.