AgentFold : Agents Web à Long Terme avec Gestion Proactive du Contexte
AgentFold: Long-Horizon Web Agents with Proactive Context Management
October 28, 2025
papers.authors: Rui Ye, Zhongwang Zhang, Kuan Li, Huifeng Yin, Zhengwei Tao, Yida Zhao, Liangcai Su, Liwen Zhang, Zile Qiao, Xinyu Wang, Pengjun Xie, Fei Huang, Siheng Chen, Jingren Zhou, Yong Jiang
cs.AI
papers.abstract
Les agents web basés sur LLM présentent un immense potentiel pour la recherche d'informations, mais leur efficacité sur les tâches à long terme est entravée par un compromis fondamental dans la gestion du contexte. Les agents prédominants de type ReAct souffrent d'une saturation contextuelle en accumulant des historiques bruts et bruyants, tandis que les méthodes qui résument rigidement l'historique complet à chaque étape risquent la perte irréversible de détails critiques. Pour résoudre ces problèmes, nous présentons AgentFold, un nouveau paradigme d'agent centré sur la gestion proactive du contexte, inspiré du processus cognitif humain de consolidation rétrospective. AgentFold traite son contexte comme un espace de travail cognitif dynamique à sculpter activement, plutôt que comme un journal passif à remplir. À chaque étape, il apprend à exécuter une opération de « repliement » qui gère sa trajectoire historique à multiples échelles : il peut effectuer des condensations granulaires pour préserver des détails fins essentiels, ou des consolidations profondes pour abstraire des sous-tâches multi-étapes entières. Les résultats sur des benchmarks majeurs sont frappants : avec un simple réglage fin supervisé (sans pré-entraînement continu ni RL), notre agent AgentFold-30B-A3B atteint 36,2 % sur BrowseComp et 47,3 % sur BrowseComp-ZH. Notamment, cette performance surpasse ou égale non seulement des modèles open-source d'une échelle considérablement plus grande, comme le DeepSeek-V3.1-671B-A37B, mais dépasse également les agents propriétaires leaders comme l'o4-mini d'OpenAI.
English
LLM-based web agents show immense promise for information seeking, yet their
effectiveness on long-horizon tasks is hindered by a fundamental trade-off in
context management. Prevailing ReAct-based agents suffer from context
saturation as they accumulate noisy, raw histories, while methods that fixedly
summarize the full history at each step risk the irreversible loss of critical
details. Addressing these, we introduce AgentFold, a novel agent paradigm
centered on proactive context management, inspired by the human cognitive
process of retrospective consolidation. AgentFold treats its context as a
dynamic cognitive workspace to be actively sculpted, rather than a passive log
to be filled. At each step, it learns to execute a `folding' operation, which
manages its historical trajectory at multiple scales: it can perform granular
condensations to preserve vital, fine-grained details, or deep consolidations
to abstract away entire multi-step sub-tasks. The results on prominent
benchmarks are striking: with simple supervised fine-tuning (without continual
pre-training or RL), our AgentFold-30B-A3B agent achieves 36.2% on BrowseComp
and 47.3% on BrowseComp-ZH. Notably, this performance not only surpasses or
matches open-source models of a dramatically larger scale, such as the
DeepSeek-V3.1-671B-A37B, but also surpasses leading proprietary agents like
OpenAI's o4-mini.