ChatPaper.aiChatPaper

Paper2Web: Давайте оживим вашу статью!

Paper2Web: Let's Make Your Paper Alive!

October 17, 2025
Авторы: Yuhang Chen, Tianpeng Lv, Siyi Zhang, Yixiang Yin, Yao Wan, Philip S. Yu, Dongping Chen
cs.AI

Аннотация

Академические проектные сайты могут более эффективно распространять исследования, если они четко представляют основное содержание и обеспечивают интуитивную навигацию и взаимодействие. Однако текущие подходы, такие как прямое создание с использованием больших языковых моделей (LLM), шаблоны или прямое преобразование в HTML, сталкиваются с трудностями в создании сайтов с учетом макета и интерактивности, а также отсутствует комплексный набор инструментов для оценки этой задачи. В данной статье мы представляем Paper2Web — эталонный набор данных и многомерную структуру оценки для создания академических веб-страниц. Он включает в себя метрики на основе правил, такие как Связность, Полнота, а также проверенные людьми оценки с использованием LLM-as-a-Judge (охватывающие интерактивность, эстетику и информативность), и PaperQuiz, который измеряет уровень усвоения знаний на уровне статьи. Мы также представляем PWAgent — автономный конвейер, преобразующий научные статьи в интерактивные и мультимедийные академические страницы. Агент итеративно улучшает как содержание, так и макет с помощью инструментов MCP, которые повышают акценты, баланс и качество презентации. Наши эксперименты показывают, что PWAgent значительно превосходит базовые подходы, такие как шаблонные веб-страницы и версии arXiv/alphaXiv, при этом сохраняя низкую стоимость и достигая Парето-фронта в создании академических веб-страниц.
English
Academic project websites can more effectively disseminate research when they clearly present core content and enable intuitive navigation and interaction. However, current approaches such as direct Large Language Model (LLM) generation, templates, or direct HTML conversion struggle to produce layout-aware, interactive sites, and a comprehensive evaluation suite for this task has been lacking. In this paper, we introduce Paper2Web, a benchmark dataset and multi-dimensional evaluation framework for assessing academic webpage generation. It incorporates rule-based metrics like Connectivity, Completeness and human-verified LLM-as-a-Judge (covering interactivity, aesthetics, and informativeness), and PaperQuiz, which measures paper-level knowledge retention. We further present PWAgent, an autonomous pipeline that converts scientific papers into interactive and multimedia-rich academic homepages. The agent iteratively refines both content and layout through MCP tools that enhance emphasis, balance, and presentation quality. Our experiments show that PWAgent consistently outperforms end-to-end baselines like template-based webpages and arXiv/alphaXiv versions by a large margin while maintaining low cost, achieving the Pareto-front in academic webpage generation.
PDF204October 20, 2025