ChatPaper.aiChatPaper

Paper2Web : Donnons vie à votre article !

Paper2Web: Let's Make Your Paper Alive!

October 17, 2025
papers.authors: Yuhang Chen, Tianpeng Lv, Siyi Zhang, Yixiang Yin, Yao Wan, Philip S. Yu, Dongping Chen
cs.AI

papers.abstract

Les sites web de projets académiques peuvent diffuser la recherche plus efficacement lorsqu'ils présentent clairement le contenu principal et permettent une navigation et une interaction intuitives. Cependant, les approches actuelles, telles que la génération directe par des modèles de langage de grande taille (LLM), l'utilisation de modèles prédéfinis ou la conversion directe en HTML, peinent à produire des sites interactifs et conscients de la mise en page, et un ensemble d'évaluation complet pour cette tâche fait défaut. Dans cet article, nous présentons Paper2Web, un ensemble de données de référence et un cadre d'évaluation multidimensionnel pour évaluer la génération de pages web académiques. Il intègre des métriques basées sur des règles comme la Connectivité, l'Exhaustivité, ainsi qu'une évaluation humaine via LLM-as-a-Judge (couvrant l'interactivité, l'esthétique et l'informativité), et PaperQuiz, qui mesure la rétention des connaissances au niveau de l'article. Nous présentons également PWAgent, un pipeline autonome qui convertit des articles scientifiques en pages d'accueil académiques interactives et riches en multimédia. L'agent affine itérativement à la fois le contenu et la mise en page grâce à des outils MCP qui améliorent l'emphase, l'équilibre et la qualité de la présentation. Nos expériences montrent que PWAgent surpasse systématiquement les approches de bout en bout, telles que les pages web basées sur des modèles et les versions arXiv/alphaXiv, tout en maintenant un faible coût, atteignant ainsi le front de Pareto dans la génération de pages web académiques.
English
Academic project websites can more effectively disseminate research when they clearly present core content and enable intuitive navigation and interaction. However, current approaches such as direct Large Language Model (LLM) generation, templates, or direct HTML conversion struggle to produce layout-aware, interactive sites, and a comprehensive evaluation suite for this task has been lacking. In this paper, we introduce Paper2Web, a benchmark dataset and multi-dimensional evaluation framework for assessing academic webpage generation. It incorporates rule-based metrics like Connectivity, Completeness and human-verified LLM-as-a-Judge (covering interactivity, aesthetics, and informativeness), and PaperQuiz, which measures paper-level knowledge retention. We further present PWAgent, an autonomous pipeline that converts scientific papers into interactive and multimedia-rich academic homepages. The agent iteratively refines both content and layout through MCP tools that enhance emphasis, balance, and presentation quality. Our experiments show that PWAgent consistently outperforms end-to-end baselines like template-based webpages and arXiv/alphaXiv versions by a large margin while maintaining low cost, achieving the Pareto-front in academic webpage generation.
PDF204October 20, 2025