PaperBanana: Automatizzazione dell'Illustrazione Accademica per Scienziati dell'IA

Abstract

Nonostante i rapidi progressi degli scienziati IA autonomi basati su modelli linguistici, la generazione di illustrazioni pronte per la pubblicazione rimane un collo di bottiglia ad alta intensità di lavoro nel flusso di ricerca. Per alleviare questo onere, presentiamo PaperBanana, un framework agentivo per la generazione automatizzata di illustrazioni accademiche pronte per la pubblicazione. Basandosi su modelli visivo-linguistici (VLM) e modelli di generazione di immagini all'avanguardia, PaperBanana orchestra agenti specializzati per recuperare riferimenti, pianificare contenuti e stile, renderizzare immagini e perfezionare iterativamente tramite auto-critica. Per valutare rigorosamente il nostro framework, introduciamo PaperBananaBench, comprendente 292 casi di test per diagrammi metodologici selezionati da pubblicazioni NeurIPS 2025, che coprono diversi domini di ricerca e stili illustrativi. Esperimenti completi dimostrano che PaperBanana supera costantemente i principali baseline in termini di fedeltà, concisione, leggibilità ed estetica. Mostriamo inoltre che il nostro metodo si estende efficacemente alla generazione di grafici statistici di alta qualità. Nel complesso, PaperBanana apre la strada alla generazione automatizzata di illustrazioni pronte per la pubblicazione.

English

Despite rapid advances in autonomous AI scientists powered by language models, generating publication-ready illustrations remains a labor-intensive bottleneck in the research workflow. To lift this burden, we introduce PaperBanana, an agentic framework for automated generation of publication-ready academic illustrations. Powered by state-of-the-art VLMs and image generation models, PaperBanana orchestrates specialized agents to retrieve references, plan content and style, render images, and iteratively refine via self-critique. To rigorously evaluate our framework, we introduce PaperBananaBench, comprising 292 test cases for methodology diagrams curated from NeurIPS 2025 publications, covering diverse research domains and illustration styles. Comprehensive experiments demonstrate that PaperBanana consistently outperforms leading baselines in faithfulness, conciseness, readability, and aesthetics. We further show that our method effectively extends to the generation of high-quality statistical plots. Collectively, PaperBanana paves the way for the automated generation of publication-ready illustrations.

PaperBanana: Automatizzazione dell'Illustrazione Accademica per Scienziati dell'IA

PaperBanana: Automating Academic Illustration for AI Scientists

Abstract

Support