ParallelMuse: Pensamento Paralelo Agente para Busca Profunda de Informações
ParallelMuse: Agentic Parallel Thinking for Deep Information Seeking
October 28, 2025
Autores: Baixuan Li, Dingchu Zhang, Jialong Wu, Wenbiao Yin, Zhengwei Tao, Yida Zhao, Liwen Zhang, Haiyang Shen, Runnan Fang, Pengjun Xie, Jingren Zhou, Yong Jiang
cs.AI
Resumo
O pensamento paralelo expande a amplitude de exploração, complementando a exploração profunda de agentes de busca de informação (IS) para aprimorar ainda mais a capacidade de resolução de problemas. No entanto, o pensamento paralelo convencional enfrenta dois desafios principais nesse contexto: a ineficiência decorrente da repetida execução a partir do zero e a dificuldade de integrar trajetórias de raciocínio de longo horizonte durante a geração de respostas, uma vez que a capacidade limitada de contexto impede a consideração completa do processo de raciocínio. Para resolver essas questões, propomos o ParallelMuse, um paradigma de dois estágios projetado para agentes IS profundos. O primeiro estágio, *Functionality-Specified Partial Rollout* (Rollout Parcial com Funcionalidade Especificada), particiona sequências geradas em regiões funcionais e realiza reutilização e ramificação de caminhos guiadas por incerteza para aumentar a eficiência da exploração. O segundo estágio, *Compressed Reasoning Aggregation* (Agregação de Raciocínio Comprimido), explora a redundância do raciocínio para comprimir sem perdas as informações relevantes para a derivação da resposta e sintetizar uma resposta final coerente. Experimentos realizados com múltiplos agentes de código aberto e benchmarks demonstram uma melhoria de desempenho de até 62% com uma redução de 10 a 30% no consumo de tokens exploratórios.
English
Parallel thinking expands exploration breadth, complementing the deep
exploration of information-seeking (IS) agents to further enhance
problem-solving capability. However, conventional parallel thinking faces two
key challenges in this setting: inefficiency from repeatedly rolling out from
scratch, and difficulty in integrating long-horizon reasoning trajectories
during answer generation, as limited context capacity prevents full
consideration of the reasoning process. To address these issues, we propose
ParallelMuse, a two-stage paradigm designed for deep IS agents. The first
stage, Functionality-Specified Partial Rollout, partitions generated sequences
into functional regions and performs uncertainty-guided path reuse and
branching to enhance exploration efficiency. The second stage, Compressed
Reasoning Aggregation, exploits reasoning redundancy to losslessly compress
information relevant to answer derivation and synthesize a coherent final
answer. Experiments across multiple open-source agents and benchmarks
demonstrate up to 62% performance improvement with a 10--30% reduction in
exploratory token consumption.