Realizzazione Collaborativa Uomo-Agente di Carta a Pagina a Costo Inferiore a 0,1 Dollari
Human-Agent Collaborative Paper-to-Page Crafting for Under $0.1
October 22, 2025
Autori: Qianli Ma, Siyu Wang, Yilin Chen, Yinhao Tang, Yixiang Yang, Chang Guo, Bingjie Gao, Zhening Xing, Yanan Sun, Zhipeng Zhang
cs.AI
Abstract
Nel perseguimento del progresso scientifico, comunicare la ricerca è tanto vitale quanto la scoperta stessa. Tuttavia, i ricercatori vengono spesso distolti dal compito manuale e ripetitivo di costruire pagine web di progetto per rendere accessibili i loro articoli complessi. Sebbene l'automazione abbia affrontato la creazione di slide e poster statici, la natura dinamica e interattiva delle pagine web è rimasta una sfida irrisolta. Per colmare questa lacuna, riformuliamo il problema, sostenendo che la soluzione non risieda in un singolo comando, ma in un processo collaborativo e gerarchico. Introduciamo AutoPage, un innovativo sistema multi-agente che incarna questa filosofia. AutoPage scompone la creazione da articolo a pagina in una pipeline dall'alto verso il basso, dalla pianificazione narrativa alla generazione di contenuti multimodali e al rendering interattivo. Per contrastare le allucinazioni dell'IA, agenti "Checker" dedicati verificano ogni fase rispetto all'articolo sorgente, mentre checkpoint umani opzionali garantiscono che il prodotto finale sia perfettamente allineato con la visione dell'autore, trasformando il sistema da mero strumento a potente assistente collaborativo. Per convalidare rigorosamente il nostro approccio, abbiamo anche costruito PageBench, il primo benchmark per questo nuovo compito. Gli esperimenti mostrano che AutoPage non solo genera pagine di alta qualità e visivamente accattivanti, ma lo fa con notevole efficienza in meno di 15 minuti e per meno di 0,1 dollari. Codice e dataset saranno rilasciati su https://mqleet.github.io/AutoPage_ProjectPage/{Webpage}$.
English
In the quest for scientific progress, communicating research is as vital as
the discovery itself. Yet, researchers are often sidetracked by the manual,
repetitive chore of building project webpages to make their dense papers
accessible. While automation has tackled static slides and posters, the
dynamic, interactive nature of webpages has remained an unaddressed challenge.
To bridge this gap, we reframe the problem, arguing that the solution lies not
in a single command, but in a collaborative, hierarchical process. We introduce
AutoPage, a novel multi-agent system that embodies this philosophy.
AutoPage deconstructs paper-to-page creation into a coarse-to-fine pipeline
from narrative planning to multimodal content generation and interactive
rendering. To combat AI hallucination, dedicated "Checker" agents verify each
step against the source paper, while optional human checkpoints ensure the
final product aligns perfectly with the author's vision, transforming the
system from a mere tool into a powerful collaborative assistant. To rigorously
validate our approach, we also construct PageBench, the first
benchmark for this new task. Experiments show AutoPage not only generates
high-quality, visually appealing pages but does so with remarkable efficiency
in under 15 minutes for less than \0.1. Code and dataset will be released at
https://mqleet.github.io/AutoPage_ProjectPage/{Webpage}$.