Paper2Web: あなたの論文を生き生きとさせましょう!
Paper2Web: Let's Make Your Paper Alive!
October 17, 2025
著者: Yuhang Chen, Tianpeng Lv, Siyi Zhang, Yixiang Yin, Yao Wan, Philip S. Yu, Dongping Chen
cs.AI
要旨
学術プロジェクトのウェブサイトは、コアコンテンツを明確に提示し、直感的なナビゲーションとインタラクションを可能にすることで、研究の普及をより効果的に行うことができます。しかし、現在のアプローチである大規模言語モデル(LLM)の直接生成、テンプレート、または直接HTML変換では、レイアウトを考慮したインタラクティブなサイトを生成することが難しく、このタスクに対する包括的な評価スイートが不足していました。本論文では、学術ウェブページ生成を評価するためのベンチマークデータセットと多次元評価フレームワークであるPaper2Webを紹介します。これには、接続性、完全性などのルールベースのメトリクスや、インタラクティブ性、美学、情報量をカバーする人間検証済みのLLM-as-a-Judge、および論文レベルの知識保持を測定するPaperQuizが含まれます。さらに、科学論文をインタラクティブでマルチメディア豊富な学術ホームページに変換する自律パイプラインであるPWAgentを提案します。このエージェントは、強調、バランス、プレゼンテーション品質を向上させるMCPツールを通じて、コンテンツとレイアウトを反復的に洗練します。実験結果から、PWAgentは、テンプレートベースのウェブページやarXiv/alphaXivバージョンなどのエンドツーエンドのベースラインを大幅に上回りながら、低コストを維持し、学術ウェブページ生成におけるパレートフロントを達成することが示されました。
English
Academic project websites can more effectively disseminate research when they
clearly present core content and enable intuitive navigation and interaction.
However, current approaches such as direct Large Language Model (LLM)
generation, templates, or direct HTML conversion struggle to produce
layout-aware, interactive sites, and a comprehensive evaluation suite for this
task has been lacking. In this paper, we introduce Paper2Web, a benchmark
dataset and multi-dimensional evaluation framework for assessing academic
webpage generation. It incorporates rule-based metrics like Connectivity,
Completeness and human-verified LLM-as-a-Judge (covering interactivity,
aesthetics, and informativeness), and PaperQuiz, which measures paper-level
knowledge retention. We further present PWAgent, an autonomous pipeline that
converts scientific papers into interactive and multimedia-rich academic
homepages. The agent iteratively refines both content and layout through MCP
tools that enhance emphasis, balance, and presentation quality. Our experiments
show that PWAgent consistently outperforms end-to-end baselines like
template-based webpages and arXiv/alphaXiv versions by a large margin while
maintaining low cost, achieving the Pareto-front in academic webpage
generation.