PaperBanana: AI 과학자를 위한 학술 일러스트레이션 자동화
PaperBanana: Automating Academic Illustration for AI Scientists
January 30, 2026
저자: Dawei Zhu, Rui Meng, Yale Song, Xiyu Wei, Sujian Li, Tomas Pfister, Jinsung Yoon
cs.AI
초록
언어 모델 기반 자율 AI 과학자의 급속한 발전에도 불구하고, 출판 준비가 완료된 일러스트레이션 생성은 여전히 연구 워크플로우에서 노동 집약적인 병목 현상으로 남아 있습니다. 이러한 부담을 해소하기 위해 우리는 출판 준비가 된 학술 일러스트레이션의 자동 생성을 위한 에이전트 기반 프레임워크인 PaperBanana를 소개합니다. 최첨단 VLM 및 이미지 생성 모델을 기반으로 하는 PaperBanana는 참고문헌 검색, 콘텐츠 및 스타일 기획, 이미지 렌더링, 자기 비판을 통한 반복적 개선을 수행하는 특화 에이전트들을 조율합니다. 우리의 프레임워크를 엄격하게 평가하기 위해 NeurIPS 2025 논문에서 선별한 방법론 다이어그램에 대한 292개의 테스트 케이스로 구성된 PaperBananaBench를 도입하며, 이는 다양한 연구 분야와 일러스트레이션 스타일을 포괄합니다. 포괄적인 실험을 통해 PaperBanana가 정확성, 간결성, 가독성 및 미적 측면에서 선두 기준선들을 지속적으로 능가함을 입증합니다. 또한 우리의 방법이 고품질 통계 플롯 생성으로 효과적으로 확장 가능함을 보여줍니다. 종합적으로, PaperBanana는 출판 준비 일러스트레이션의 자동 생성 길을 열어줍니다.
English
Despite rapid advances in autonomous AI scientists powered by language models, generating publication-ready illustrations remains a labor-intensive bottleneck in the research workflow. To lift this burden, we introduce PaperBanana, an agentic framework for automated generation of publication-ready academic illustrations. Powered by state-of-the-art VLMs and image generation models, PaperBanana orchestrates specialized agents to retrieve references, plan content and style, render images, and iteratively refine via self-critique. To rigorously evaluate our framework, we introduce PaperBananaBench, comprising 292 test cases for methodology diagrams curated from NeurIPS 2025 publications, covering diverse research domains and illustration styles. Comprehensive experiments demonstrate that PaperBanana consistently outperforms leading baselines in faithfulness, conciseness, readability, and aesthetics. We further show that our method effectively extends to the generation of high-quality statistical plots. Collectively, PaperBanana paves the way for the automated generation of publication-ready illustrations.