PaperBanana: Automatización de la Ilustración Académica para Científicos de IA
PaperBanana: Automating Academic Illustration for AI Scientists
January 30, 2026
Autores: Dawei Zhu, Rui Meng, Yale Song, Xiyu Wei, Sujian Li, Tomas Pfister, Jinsung Yoon
cs.AI
Resumen
A pesar de los rápidos avances en científicos de IA autónomos impulsados por modelos de lenguaje, la generación de ilustraciones listas para publicación sigue siendo un cuello de botella que requiere mucho trabajo en el flujo de investigación. Para aliviar esta carga, presentamos PaperBanana, un marco agéntico para la generación automatizada de ilustraciones académicas listas para publicación. Impulsado por modelos de lenguaje visual y generación de imágenes de vanguardia, PaperBanana orquesta agentes especializados para recuperar referencias, planificar contenido y estilo, renderizar imágenes y refinar iterativamente mediante autocrítica. Para evaluar rigurosamente nuestro marco, presentamos PaperBananaBench, que comprende 292 casos de prueba para diagramas de metodología seleccionados de publicaciones de NeurIPS 2025, abarcando diversos dominios de investigación y estilos de ilustración. Experimentos exhaustivos demuestran que PaperBanana supera consistentemente a los principales baselines en fidelidad, concisión, legibilidad y estética. Además, mostramos que nuestro método se extiende efectivamente a la generación de gráficos estadísticos de alta calidad. En conjunto, PaperBanana allana el camino para la generación automatizada de ilustraciones listas para publicación.
English
Despite rapid advances in autonomous AI scientists powered by language models, generating publication-ready illustrations remains a labor-intensive bottleneck in the research workflow. To lift this burden, we introduce PaperBanana, an agentic framework for automated generation of publication-ready academic illustrations. Powered by state-of-the-art VLMs and image generation models, PaperBanana orchestrates specialized agents to retrieve references, plan content and style, render images, and iteratively refine via self-critique. To rigorously evaluate our framework, we introduce PaperBananaBench, comprising 292 test cases for methodology diagrams curated from NeurIPS 2025 publications, covering diverse research domains and illustration styles. Comprehensive experiments demonstrate that PaperBanana consistently outperforms leading baselines in faithfulness, conciseness, readability, and aesthetics. We further show that our method effectively extends to the generation of high-quality statistical plots. Collectively, PaperBanana paves the way for the automated generation of publication-ready illustrations.