Paper2Web: ¡Hagamos que tu artículo cobre vida!
Paper2Web: Let's Make Your Paper Alive!
October 17, 2025
Autores: Yuhang Chen, Tianpeng Lv, Siyi Zhang, Yixiang Yin, Yao Wan, Philip S. Yu, Dongping Chen
cs.AI
Resumen
Los sitios web de proyectos académicos pueden difundir la investigación de manera más efectiva cuando presentan claramente el contenido principal y permiten una navegación e interacción intuitivas. Sin embargo, los enfoques actuales, como la generación directa mediante modelos de lenguaje de gran escala (LLM), el uso de plantillas o la conversión directa a HTML, tienen dificultades para producir sitios con diseños conscientes e interactivos, y ha faltado una suite de evaluación integral para esta tarea. En este artículo, presentamos Paper2Web, un conjunto de datos de referencia y un marco de evaluación multidimensional para la generación de páginas web académicas. Este incorpora métricas basadas en reglas como Conectividad, Completitud y un sistema de verificación humana mediante LLM-as-a-Judge (que cubre interactividad, estética e informatividad), junto con PaperQuiz, que mide la retención de conocimiento a nivel de artículo. Además, presentamos PWAgent, una pipeline autónoma que convierte artículos científicos en páginas de inicio académicas interactivas y enriquecidas con multimedia. El agente refina iterativamente tanto el contenido como el diseño mediante herramientas MCP que mejoran el énfasis, el equilibrio y la calidad de la presentación. Nuestros experimentos muestran que PWAgent supera consistentemente a los enfoques de referencia de extremo a extremo, como las páginas web basadas en plantillas y las versiones de arXiv/alphaXiv, por un amplio margen, manteniendo un bajo costo y alcanzando el frente de Pareto en la generación de páginas web académicas.
English
Academic project websites can more effectively disseminate research when they
clearly present core content and enable intuitive navigation and interaction.
However, current approaches such as direct Large Language Model (LLM)
generation, templates, or direct HTML conversion struggle to produce
layout-aware, interactive sites, and a comprehensive evaluation suite for this
task has been lacking. In this paper, we introduce Paper2Web, a benchmark
dataset and multi-dimensional evaluation framework for assessing academic
webpage generation. It incorporates rule-based metrics like Connectivity,
Completeness and human-verified LLM-as-a-Judge (covering interactivity,
aesthetics, and informativeness), and PaperQuiz, which measures paper-level
knowledge retention. We further present PWAgent, an autonomous pipeline that
converts scientific papers into interactive and multimedia-rich academic
homepages. The agent iteratively refines both content and layout through MCP
tools that enhance emphasis, balance, and presentation quality. Our experiments
show that PWAgent consistently outperforms end-to-end baselines like
template-based webpages and arXiv/alphaXiv versions by a large margin while
maintaining low cost, achieving the Pareto-front in academic webpage
generation.