Совместное создание бумажных страниц человеком и агентом стоимостью менее $0,1
Human-Agent Collaborative Paper-to-Page Crafting for Under $0.1
October 22, 2025
Авторы: Qianli Ma, Siyu Wang, Yilin Chen, Yinhao Tang, Yixiang Yang, Chang Guo, Bingjie Gao, Zhening Xing, Yanan Sun, Zhipeng Zhang
cs.AI
Аннотация
В стремлении к научному прогрессу коммуникация исследований столь же важна, как и само открытие. Однако исследователи часто отвлекаются на рутинную, повторяющуюся задачу создания веб-страниц проектов, чтобы сделать свои сложные статьи более доступными. Хотя автоматизация справилась со статичными слайдами и постерами, динамичная и интерактивная природа веб-страниц оставалась нерешённой проблемой. Чтобы преодолеть этот разрыв, мы переосмысливаем проблему, утверждая, что решение заключается не в одной команде, а в совместном иерархическом процессе. Мы представляем AutoPage — новую мульти-агентную систему, воплощающую эту философию. AutoPage разбивает создание страницы из статьи на поэтапный процесс от планирования повествования до мультимодального создания контента и интерактивной визуализации. Для борьбы с галлюцинациями ИИ специальные агенты-«Проверяющие» верифицируют каждый шаг на соответствие исходной статье, в то время как опциональные контрольные точки с участием человека гарантируют, что конечный продукт идеально соответствует видению автора, превращая систему из простого инструмента в мощного помощника для коллаборации. Для строгой проверки нашего подхода мы также создали PageBench — первый бенчмарк для этой новой задачи. Эксперименты показывают, что AutoPage не только генерирует высококачественные, визуально привлекательные страницы, но и делает это с замечательной эффективностью — менее чем за 15 минут и дешевле \$0,1. Код и набор данных будут опубликованы по адресу https://mqleet.github.io/AutoPage_ProjectPage/{Webpage}$.
English
In the quest for scientific progress, communicating research is as vital as
the discovery itself. Yet, researchers are often sidetracked by the manual,
repetitive chore of building project webpages to make their dense papers
accessible. While automation has tackled static slides and posters, the
dynamic, interactive nature of webpages has remained an unaddressed challenge.
To bridge this gap, we reframe the problem, arguing that the solution lies not
in a single command, but in a collaborative, hierarchical process. We introduce
AutoPage, a novel multi-agent system that embodies this philosophy.
AutoPage deconstructs paper-to-page creation into a coarse-to-fine pipeline
from narrative planning to multimodal content generation and interactive
rendering. To combat AI hallucination, dedicated "Checker" agents verify each
step against the source paper, while optional human checkpoints ensure the
final product aligns perfectly with the author's vision, transforming the
system from a mere tool into a powerful collaborative assistant. To rigorously
validate our approach, we also construct PageBench, the first
benchmark for this new task. Experiments show AutoPage not only generates
high-quality, visually appealing pages but does so with remarkable efficiency
in under 15 minutes for less than \0.1. Code and dataset will be released at
https://mqleet.github.io/AutoPage_ProjectPage/{Webpage}$.