PaperBanana: AI科学者のための学術図表作成自動化
PaperBanana: Automating Academic Illustration for AI Scientists
January 30, 2026
著者: Dawei Zhu, Rui Meng, Yale Song, Xiyu Wei, Sujian Li, Tomas Pfister, Jinsung Yoon
cs.AI
要旨
言語モデルによって駆動される自律的なAIサイエンティストの急速な進展にもかかわらず、論文掲載レベルの図表作成は研究ワークフローにおいて依然として人手を要するボトルネックとなっている。この負担を軽減するため、我々は論文掲載レベルの学術図表を自動生成するエージェントフレームワーク「PaperBanana」を提案する。最先端の視覚言語モデルと画像生成モデルを活用し、PaperBananaは参照文献の収集、内容とスタイルの計画、画像のレンダリング、自己批判による反復的な改良を専門エージェントが協調して実行する。本フレームワークを厳密に評価するため、NeurIPS 2025の論文から収集した方法論図表292テストケースから成る「PaperBananaBench」を構築した。これらは多様な研究領域と図表スタイルを網羅している。包括的な実験により、PaperBananaが忠実性、簡潔性、可読性、審美性の全ての指標で主要なベースライン手法を一貫して上回ることを実証した。さらに本手法が高品質な統計プロットの生成にも有効に適用可能であることを示す。総合的に、PaperBananaは論文掲載レベルの図表の自動生成への道を開くものである。
English
Despite rapid advances in autonomous AI scientists powered by language models, generating publication-ready illustrations remains a labor-intensive bottleneck in the research workflow. To lift this burden, we introduce PaperBanana, an agentic framework for automated generation of publication-ready academic illustrations. Powered by state-of-the-art VLMs and image generation models, PaperBanana orchestrates specialized agents to retrieve references, plan content and style, render images, and iteratively refine via self-critique. To rigorously evaluate our framework, we introduce PaperBananaBench, comprising 292 test cases for methodology diagrams curated from NeurIPS 2025 publications, covering diverse research domains and illustration styles. Comprehensive experiments demonstrate that PaperBanana consistently outperforms leading baselines in faithfulness, conciseness, readability, and aesthetics. We further show that our method effectively extends to the generation of high-quality statistical plots. Collectively, PaperBanana paves the way for the automated generation of publication-ready illustrations.