Paper2Web: Lassen Sie Ihr Paper lebendig werden!
Paper2Web: Let's Make Your Paper Alive!
October 17, 2025
papers.authors: Yuhang Chen, Tianpeng Lv, Siyi Zhang, Yixiang Yin, Yao Wan, Philip S. Yu, Dongping Chen
cs.AI
papers.abstract
Akademische Projektwebsites können Forschung effektiver verbreiten, wenn sie Kerninhalte klar präsentieren und intuitive Navigation sowie Interaktion ermöglichen. Aktuelle Ansätze wie die direkte Generierung durch Large Language Models (LLMs), Vorlagen oder direkte HTML-Konvertierung haben jedoch Schwierigkeiten, layoutbewusste und interaktive Websites zu erstellen, und es fehlt an einem umfassenden Bewertungsrahmen für diese Aufgabe. In diesem Artikel stellen wir Paper2Web vor, einen Benchmark-Datensatz und ein mehrdimensionales Bewertungsframework zur Beurteilung der Generierung akademischer Webseiten. Es umfasst regelbasierte Metriken wie Konnektivität, Vollständigkeit und durch Menschen verifizierte LLM-as-a-Judge-Bewertungen (die Interaktivität, Ästhetik und Informationsgehalt abdecken) sowie PaperQuiz, das das Behalten von Wissen auf Papierebene misst. Darüber hinaus präsentieren wir PWAgent, eine autonome Pipeline, die wissenschaftliche Arbeiten in interaktive und multimediale akademische Homepages umwandelt. Der Agent verfeinert sowohl Inhalte als auch Layout iterativ durch MCP-Tools, die Betonung, Ausgewogenheit und Präsentationsqualität verbessern. Unsere Experimente zeigen, dass PWAgent End-to-End-Baselines wie vorlagenbasierte Webseiten und arXiv/alphaXiv-Versionen durchgehend deutlich übertrifft, bei gleichzeitig niedrigen Kosten und der Erreichung der Pareto-Front in der Generierung akademischer Webseiten.
English
Academic project websites can more effectively disseminate research when they
clearly present core content and enable intuitive navigation and interaction.
However, current approaches such as direct Large Language Model (LLM)
generation, templates, or direct HTML conversion struggle to produce
layout-aware, interactive sites, and a comprehensive evaluation suite for this
task has been lacking. In this paper, we introduce Paper2Web, a benchmark
dataset and multi-dimensional evaluation framework for assessing academic
webpage generation. It incorporates rule-based metrics like Connectivity,
Completeness and human-verified LLM-as-a-Judge (covering interactivity,
aesthetics, and informativeness), and PaperQuiz, which measures paper-level
knowledge retention. We further present PWAgent, an autonomous pipeline that
converts scientific papers into interactive and multimedia-rich academic
homepages. The agent iteratively refines both content and layout through MCP
tools that enhance emphasis, balance, and presentation quality. Our experiments
show that PWAgent consistently outperforms end-to-end baselines like
template-based webpages and arXiv/alphaXiv versions by a large margin while
maintaining low cost, achieving the Pareto-front in academic webpage
generation.