PaperBanana: Automatisierung wissenschaftlicher Illustrationen für KI-Wissenschaftler
PaperBanana: Automating Academic Illustration for AI Scientists
January 30, 2026
papers.authors: Dawei Zhu, Rui Meng, Yale Song, Xiyu Wei, Sujian Li, Tomas Pfister, Jinsung Yoon
cs.AI
papers.abstract
Trotz rasanter Fortschritte bei autonomen KI-Wissenschaftlern, die auf Sprachmodellen basieren, bleibt die Erstellung publikationsreifer Illustrationen ein arbeitsintensiver Engpass im Forschungsablauf. Um diese Last zu verringern, stellen wir PaperBanana vor, einen agentenbasierten Rahmen für die automatische Generierung publikationsreifer akademischer Illustrationen. Angetrieben durch modernste VLMs und Bildgenerierungsmodelle, orchestriert PaperBanana spezialisierte Agenten zum Abrufen von Referenzen, zur Planung von Inhalt und Stil, zum Rendern von Bildern und zur iterativen Verbesserung durch Selbstkritik. Um unser Framework rigoros zu evaluieren, führen wir PaperBananaBench ein, das 292 Testfälle für Methodikdiagramme umfasst, die aus NeurIPS-2025-Publikationen zusammengestellt wurden und verschiedene Forschungsdomänen und Illustrationsstile abdecken. Umfassende Experimente zeigen, dass PaperBanana führende Baseline-Methoden konsequent in Bezug auf Korrektheit, Prägnanz, Lesbarkeit und Ästhetik übertrifft. Wir zeigen weiterhin, dass sich unsere Methode effektiv auf die Generierung hochwertiger statistischer Diagramme erweitern lässt. Insgesamt ebnet PaperBanana den Weg für die automatische Erstellung publikationsreifer Illustrationen.
English
Despite rapid advances in autonomous AI scientists powered by language models, generating publication-ready illustrations remains a labor-intensive bottleneck in the research workflow. To lift this burden, we introduce PaperBanana, an agentic framework for automated generation of publication-ready academic illustrations. Powered by state-of-the-art VLMs and image generation models, PaperBanana orchestrates specialized agents to retrieve references, plan content and style, render images, and iteratively refine via self-critique. To rigorously evaluate our framework, we introduce PaperBananaBench, comprising 292 test cases for methodology diagrams curated from NeurIPS 2025 publications, covering diverse research domains and illustration styles. Comprehensive experiments demonstrate that PaperBanana consistently outperforms leading baselines in faithfulness, conciseness, readability, and aesthetics. We further show that our method effectively extends to the generation of high-quality statistical plots. Collectively, PaperBanana paves the way for the automated generation of publication-ready illustrations.