PaperBanana: Automatisering van Academische Illustraties voor AI-wetenschappers
PaperBanana: Automating Academic Illustration for AI Scientists
January 30, 2026
Auteurs: Dawei Zhu, Rui Meng, Yale Song, Xiyu Wei, Sujian Li, Tomas Pfister, Jinsung Yoon
cs.AI
Samenvatting
Ondanks de snelle vooruitgang in autonome AI-wetenschappers aangedreven door taalmodellen, blijft het genereren van publicatieklare illustraties een arbeidsintensief knelpunt in de onderzoekswerkflow. Om deze last te verlichten, introduceren wij PaperBanana, een agent-gebaseerd raamwerk voor de geautomatiseerde generatie van publicatieklare academische illustraties. Aangedreven door state-of-the-art VLMs en beeldgeneratiemodellen, coördineert PaperBanana gespecialiseerde agents om referenties op te halen, inhoud en stijl te plannen, beelden te renderen en iteratief te verfijnen via zelfkritiek. Om ons raamwerk rigoureus te evalueren, introduceren we PaperBananaBench, bestaande uit 292 testgevallen voor methodologie-diagrammen samengesteld uit NeurIPS 2025-publicaties, die diverse onderzoeksdomeinen en illustratiestijlen bestrijken. Uitgebreide experimenten tonen aan dat PaperBanana consistent beter presteert dan toonaangevende baseline-methoden op het gebied van nauwkeurigheid, beknoptheid, leesbaarheid en esthetiek. We tonen verder aan dat onze methode effectief uitbreidt naar de generatie van hoogwaardige statistische grafieken. Gezamenlijk baant PaperBanana de weg voor de geautomatiseerde generatie van publicatieklare illustraties.
English
Despite rapid advances in autonomous AI scientists powered by language models, generating publication-ready illustrations remains a labor-intensive bottleneck in the research workflow. To lift this burden, we introduce PaperBanana, an agentic framework for automated generation of publication-ready academic illustrations. Powered by state-of-the-art VLMs and image generation models, PaperBanana orchestrates specialized agents to retrieve references, plan content and style, render images, and iteratively refine via self-critique. To rigorously evaluate our framework, we introduce PaperBananaBench, comprising 292 test cases for methodology diagrams curated from NeurIPS 2025 publications, covering diverse research domains and illustration styles. Comprehensive experiments demonstrate that PaperBanana consistently outperforms leading baselines in faithfulness, conciseness, readability, and aesthetics. We further show that our method effectively extends to the generation of high-quality statistical plots. Collectively, PaperBanana paves the way for the automated generation of publication-ready illustrations.