AutoFigure: 출판 가능한 과학 일러스트레이션 생성 및 정제
AutoFigure: Generating and Refining Publication-Ready Scientific Illustrations
February 3, 2026
저자: Minjun Zhu, Zhen Lin, Yixuan Weng, Panzhong Lu, Qiujie Xie, Yifan Wei, Sifan Liu, Qiyao Sun, Yue Zhang
cs.AI
초록
고품질 과학 일러스트레이션은 복잡한 과학 및 기술 개념을 효과적으로 전달하는 데 핵심적이지만, 이를 수동으로 제작하는 작업은 학계와 산업계 모두에서 널리 인정된 병목 현상으로 남아 있습니다. 본 연구에서는 장문의 과학 텍스트로부터 과학 일러스트레이션을 생성하기 위한 최초의 대규모 벤치마크인 FigureBench을 소개합니다. FigureBench은 3,300개의 고품질 과학 텍스트-일러스트레이션 쌍을 포함하며, 과학 논문, 총설, 블로그, 교재에 이르기까지 다양한 텍스트-일러스트레이션 변환 작업을 포괄합니다. 더 나아가, 장문의 과학 텍스트를 기반으로 고품질 과학 일러스트레이션을 자동 생성하는 최초의 에이전트 기반 프레임워크인 AutoFigure를 제안합니다. 구체적으로, AutoFigure는 최종 결과물을 렌더링하기 전에 집중적인 사고, 재조합 및 검증 과정을 거쳐 구조적으로 견고하고 미적으로 정제된 레이아웃을 생성함으로써, 구조적 완전성과 미적 매력을 모두 갖춘 과학 일러스트레이션을 출력합니다. FigureBench의 고품질 데이터를 활용하여 AutoFigure의 성능을 다양한 기준 방법들과 비교하는 폭넓은 실험을 수행했습니다. 결과에 따르면 AutoFigure는 모든 기준 방법들을 일관되게 능가하며, 출판 가능한 수준의 과학 일러스트레이션을 생성하는 것으로 나타났습니다. 코드, 데이터셋 및 허깅페이스 스페이스는 https://github.com/ResearAI/AutoFigure에서 공개되었습니다.
English
High-quality scientific illustrations are crucial for effectively communicating complex scientific and technical concepts, yet their manual creation remains a well-recognized bottleneck in both academia and industry. We present FigureBench, the first large-scale benchmark for generating scientific illustrations from long-form scientific texts. It contains 3,300 high-quality scientific text-figure pairs, covering diverse text-to-illustration tasks from scientific papers, surveys, blogs, and textbooks. Moreover, we propose AutoFigure, the first agentic framework that automatically generates high-quality scientific illustrations based on long-form scientific text. Specifically, before rendering the final result, AutoFigure engages in extensive thinking, recombination, and validation to produce a layout that is both structurally sound and aesthetically refined, outputting a scientific illustration that achieves both structural completeness and aesthetic appeal. Leveraging the high-quality data from FigureBench, we conduct extensive experiments to test the performance of AutoFigure against various baseline methods. The results demonstrate that AutoFigure consistently surpasses all baseline methods, producing publication-ready scientific illustrations. The code, dataset and huggingface space are released in https://github.com/ResearAI/AutoFigure.