AutoFigure: Generación y Perfeccionamiento de Ilustraciones Científicas Listas para Publicación
AutoFigure: Generating and Refining Publication-Ready Scientific Illustrations
February 3, 2026
Autores: Minjun Zhu, Zhen Lin, Yixuan Weng, Panzhong Lu, Qiujie Xie, Yifan Wei, Sifan Liu, Qiyao Sun, Yue Zhang
cs.AI
Resumen
Las ilustraciones científicas de alta calidad son cruciales para comunicar eficazmente conceptos científicos y técnicos complejos, sin embargo, su creación manual sigue siendo un cuello de botella ampliamente reconocido tanto en el ámbito académico como en el industrial. Presentamos FigureBench, el primer benchmark a gran escala para generar ilustraciones científicas a partir de textos científicos extensos. Contiene 3.300 pares texto-figura de alta calidad, que abarcan diversas tareas de conversión de texto a ilustración procedentes de artículos científicos, revisiones, blogs y libros de texto. Además, proponemos AutoFigure, el primer marco de trabajo agéntico que genera automáticamente ilustraciones científicas de alta calidad basándose en textos científicos extensos. Específicamente, antes de renderizar el resultado final, AutoFigure lleva a cabo un extenso proceso de razonamiento, recombinación y validación para producir un diseño que sea estructuralmente sólido y estéticamente refinado, generando una ilustración científica que logra tanto la integridad estructural como el atractivo estético. Aprovechando los datos de alta calidad de FigureBench, realizamos experimentos exhaustivos para evaluar el rendimiento de AutoFigure frente a varios métodos baseline. Los resultados demuestran que AutoFigure supera consistentemente a todos los métodos baseline, produciendo ilustraciones científicas listas para su publicación. El código, el conjunto de datos y el espacio de HuggingFace se han publicado en https://github.com/ResearAI/AutoFigure.
English
High-quality scientific illustrations are crucial for effectively communicating complex scientific and technical concepts, yet their manual creation remains a well-recognized bottleneck in both academia and industry. We present FigureBench, the first large-scale benchmark for generating scientific illustrations from long-form scientific texts. It contains 3,300 high-quality scientific text-figure pairs, covering diverse text-to-illustration tasks from scientific papers, surveys, blogs, and textbooks. Moreover, we propose AutoFigure, the first agentic framework that automatically generates high-quality scientific illustrations based on long-form scientific text. Specifically, before rendering the final result, AutoFigure engages in extensive thinking, recombination, and validation to produce a layout that is both structurally sound and aesthetically refined, outputting a scientific illustration that achieves both structural completeness and aesthetic appeal. Leveraging the high-quality data from FigureBench, we conduct extensive experiments to test the performance of AutoFigure against various baseline methods. The results demonstrate that AutoFigure consistently surpasses all baseline methods, producing publication-ready scientific illustrations. The code, dataset and huggingface space are released in https://github.com/ResearAI/AutoFigure.