ChatPaper.aiChatPaper

Paper2Web: Rendiamo il tuo articolo vivo!

Paper2Web: Let's Make Your Paper Alive!

October 17, 2025
Autori: Yuhang Chen, Tianpeng Lv, Siyi Zhang, Yixiang Yin, Yao Wan, Philip S. Yu, Dongping Chen
cs.AI

Abstract

I siti web di progetti accademici possono diffondere la ricerca in modo più efficace quando presentano chiaramente i contenuti principali e consentono una navigazione e un'interazione intuitive. Tuttavia, gli approcci attuali come la generazione diretta tramite Large Language Model (LLM), l'uso di template o la conversione diretta in HTML faticano a produrre siti con layout consapevoli e interattivi, e una suite di valutazione completa per questo compito è stata carente. In questo articolo, introduciamo Paper2Web, un dataset di riferimento e un framework di valutazione multidimensionale per la generazione di pagine web accademiche. Esso incorpora metriche basate su regole come Connettività, Completezza e un sistema LLM-as-a-Judge verificato da esseri umani (che copre interattività, estetica e informatività), oltre a PaperQuiz, che misura la ritenzione delle conoscenze a livello di articolo. Presentiamo inoltre PWAgent, una pipeline autonoma che converte articoli scientifici in homepage accademiche interattive e ricche di multimedia. L'agente affina iterativamente sia i contenuti che il layout attraverso strumenti MCP che migliorano l'enfasi, l'equilibrio e la qualità della presentazione. I nostri esperimenti dimostrano che PWAgent supera costantemente i baseline end-to-end come pagine web basate su template e versioni arXiv/alphaXiv con un ampio margine, mantenendo costi contenuti e raggiungendo il Pareto-front nella generazione di pagine web accademiche.
English
Academic project websites can more effectively disseminate research when they clearly present core content and enable intuitive navigation and interaction. However, current approaches such as direct Large Language Model (LLM) generation, templates, or direct HTML conversion struggle to produce layout-aware, interactive sites, and a comprehensive evaluation suite for this task has been lacking. In this paper, we introduce Paper2Web, a benchmark dataset and multi-dimensional evaluation framework for assessing academic webpage generation. It incorporates rule-based metrics like Connectivity, Completeness and human-verified LLM-as-a-Judge (covering interactivity, aesthetics, and informativeness), and PaperQuiz, which measures paper-level knowledge retention. We further present PWAgent, an autonomous pipeline that converts scientific papers into interactive and multimedia-rich academic homepages. The agent iteratively refines both content and layout through MCP tools that enhance emphasis, balance, and presentation quality. Our experiments show that PWAgent consistently outperforms end-to-end baselines like template-based webpages and arXiv/alphaXiv versions by a large margin while maintaining low cost, achieving the Pareto-front in academic webpage generation.
PDF204October 20, 2025