Paper2Web: Laten we je paper tot leven brengen!
Paper2Web: Let's Make Your Paper Alive!
October 17, 2025
Auteurs: Yuhang Chen, Tianpeng Lv, Siyi Zhang, Yixiang Yin, Yao Wan, Philip S. Yu, Dongping Chen
cs.AI
Samenvatting
Academische projectwebsites kunnen onderzoek effectiever verspreiden wanneer ze kerninhoud duidelijk presenteren en intuïtieve navigatie en interactie mogelijk maken. Huidige benaderingen zoals directe generatie met Large Language Models (LLM), sjablonen of directe HTML-conversie hebben echter moeite om lay-outbewuste, interactieve sites te produceren, en een uitgebreide evaluatiesuite voor deze taak ontbreekt. In dit artikel introduceren we Paper2Web, een benchmarkdataset en een multidimensionaal evaluatiekader voor het beoordelen van het genereren van academische webpagina's. Het omvat op regels gebaseerde metrieken zoals Connectiviteit, Volledigheid en door mensen geverifieerde LLM-as-a-Judge (die interactiviteit, esthetiek en informatiefheid bestrijkt), en PaperQuiz, dat het behoud van kennis op papierniveau meet. We presenteren verder PWAgent, een autonome pijplijn die wetenschappelijke artikelen omzet in interactieve en multimedia-rijke academische homepages. De agent verfijnt zowel inhoud als lay-out iteratief via MCP-tools die nadruk, balans en presentatiekwaliteit verbeteren. Onze experimenten tonen aan dat PWAgent end-to-end-baselines zoals sjabloongebaseerde webpagina's en arXiv/alphaXiv-versies consequent met grote marge overtreft, terwijl de kosten laag blijven, waardoor het Pareto-front in academische webpagina-generatie wordt bereikt.
English
Academic project websites can more effectively disseminate research when they
clearly present core content and enable intuitive navigation and interaction.
However, current approaches such as direct Large Language Model (LLM)
generation, templates, or direct HTML conversion struggle to produce
layout-aware, interactive sites, and a comprehensive evaluation suite for this
task has been lacking. In this paper, we introduce Paper2Web, a benchmark
dataset and multi-dimensional evaluation framework for assessing academic
webpage generation. It incorporates rule-based metrics like Connectivity,
Completeness and human-verified LLM-as-a-Judge (covering interactivity,
aesthetics, and informativeness), and PaperQuiz, which measures paper-level
knowledge retention. We further present PWAgent, an autonomous pipeline that
converts scientific papers into interactive and multimedia-rich academic
homepages. The agent iteratively refines both content and layout through MCP
tools that enhance emphasis, balance, and presentation quality. Our experiments
show that PWAgent consistently outperforms end-to-end baselines like
template-based webpages and arXiv/alphaXiv versions by a large margin while
maintaining low cost, achieving the Pareto-front in academic webpage
generation.