ChatPaper.aiChatPaper

PaperBanana: Автоматизация создания научных иллюстраций для специалистов по ИИ

PaperBanana: Automating Academic Illustration for AI Scientists

January 30, 2026
Авторы: Dawei Zhu, Rui Meng, Yale Song, Xiyu Wei, Sujian Li, Tomas Pfister, Jinsung Yoon
cs.AI

Аннотация

Несмотря на быстрый прогресс в области автономных ИИ-ученых на основе языковых моделей, создание иллюстраций, готовых к публикации, остается трудоемким узким местом в исследовательском процессе. Чтобы снять эту нагрузку, мы представляем PaperBanana — агентный фреймворк для автоматизированного создания готовых к публикации академических иллюстраций. Используя передовые VLM и модели генерации изображений, PaperBanana координирует работу специализированных агентов для поиска референсов, планирования содержания и стиля, визуализации и итеративного улучшения через самокритику. Для строгой оценки нашего фреймворка мы представляем PaperBananaBench, включающий 292 тестовых сценария для диаграмм методологии, отобранных из публикаций NeurIPS 2025 и охватывающих различные исследовательские области и стили иллюстраций. Всесторонние эксперименты демонстрируют, что PaperBanana стабильно превосходит ведущие базовые методы по точности, лаконичности, читаемости и эстетике. Мы также показываем, что наш метод эффективно расширяется для генерации высококачественных статистических графиков. В совокупности PaperBanana открывает путь к автоматизированному созданию иллюстраций, готовых к публикации.
English
Despite rapid advances in autonomous AI scientists powered by language models, generating publication-ready illustrations remains a labor-intensive bottleneck in the research workflow. To lift this burden, we introduce PaperBanana, an agentic framework for automated generation of publication-ready academic illustrations. Powered by state-of-the-art VLMs and image generation models, PaperBanana orchestrates specialized agents to retrieve references, plan content and style, render images, and iteratively refine via self-critique. To rigorously evaluate our framework, we introduce PaperBananaBench, comprising 292 test cases for methodology diagrams curated from NeurIPS 2025 publications, covering diverse research domains and illustration styles. Comprehensive experiments demonstrate that PaperBanana consistently outperforms leading baselines in faithfulness, conciseness, readability, and aesthetics. We further show that our method effectively extends to the generation of high-quality statistical plots. Collectively, PaperBanana paves the way for the automated generation of publication-ready illustrations.
PDF413February 3, 2026