Paper2Web: Lassen Sie Ihr Paper lebendig werden!

papers.abstract

Akademische Projektwebsites können Forschung effektiver verbreiten, wenn sie Kerninhalte klar präsentieren und intuitive Navigation sowie Interaktion ermöglichen. Aktuelle Ansätze wie die direkte Generierung durch Large Language Models (LLMs), Vorlagen oder direkte HTML-Konvertierung haben jedoch Schwierigkeiten, layoutbewusste und interaktive Websites zu erstellen, und es fehlt an einem umfassenden Bewertungsrahmen für diese Aufgabe. In diesem Artikel stellen wir Paper2Web vor, einen Benchmark-Datensatz und ein mehrdimensionales Bewertungsframework zur Beurteilung der Generierung akademischer Webseiten. Es umfasst regelbasierte Metriken wie Konnektivität, Vollständigkeit und durch Menschen verifizierte LLM-as-a-Judge-Bewertungen (die Interaktivität, Ästhetik und Informationsgehalt abdecken) sowie PaperQuiz, das das Behalten von Wissen auf Papierebene misst. Darüber hinaus präsentieren wir PWAgent, eine autonome Pipeline, die wissenschaftliche Arbeiten in interaktive und multimediale akademische Homepages umwandelt. Der Agent verfeinert sowohl Inhalte als auch Layout iterativ durch MCP-Tools, die Betonung, Ausgewogenheit und Präsentationsqualität verbessern. Unsere Experimente zeigen, dass PWAgent End-to-End-Baselines wie vorlagenbasierte Webseiten und arXiv/alphaXiv-Versionen durchgehend deutlich übertrifft, bei gleichzeitig niedrigen Kosten und der Erreichung der Pareto-Front in der Generierung akademischer Webseiten.

English

Academic project websites can more effectively disseminate research when they clearly present core content and enable intuitive navigation and interaction. However, current approaches such as direct Large Language Model (LLM) generation, templates, or direct HTML conversion struggle to produce layout-aware, interactive sites, and a comprehensive evaluation suite for this task has been lacking. In this paper, we introduce Paper2Web, a benchmark dataset and multi-dimensional evaluation framework for assessing academic webpage generation. It incorporates rule-based metrics like Connectivity, Completeness and human-verified LLM-as-a-Judge (covering interactivity, aesthetics, and informativeness), and PaperQuiz, which measures paper-level knowledge retention. We further present PWAgent, an autonomous pipeline that converts scientific papers into interactive and multimedia-rich academic homepages. The agent iteratively refines both content and layout through MCP tools that enhance emphasis, balance, and presentation quality. Our experiments show that PWAgent consistently outperforms end-to-end baselines like template-based webpages and arXiv/alphaXiv versions by a large margin while maintaining low cost, achieving the Pareto-front in academic webpage generation.

Paper2Web: Lassen Sie Ihr Paper lebendig werden!

Paper2Web: Let's Make Your Paper Alive!

papers.abstract

Support