ParallelMuse: Pensiero Parallello Agente per l'Esplorazione Profonda delle Informazioni
ParallelMuse: Agentic Parallel Thinking for Deep Information Seeking
October 28, 2025
Autori: Baixuan Li, Dingchu Zhang, Jialong Wu, Wenbiao Yin, Zhengwei Tao, Yida Zhao, Liwen Zhang, Haiyang Shen, Runnan Fang, Pengjun Xie, Jingren Zhou, Yong Jiang
cs.AI
Abstract
Il pensiero parallelo amplia l'ampiezza esplorativa, integrando l'esplorazione profonda degli agenti di information-seeking (IS) per potenziare ulteriormente le capacità di problem-solving. Tuttavia, l'approccio parallelo convenziale incontra due sfide principali in questo contesto: l'inefficienza derivante dalla ripetuta esecuzione da zero e la difficoltà nell'integrare traiettorie di ragionamento a lungo termine durante la generazione della risposta, poiché la limitata capacità contestuale impedisce una piena considerazione del processo deduttivo. Per affrontare questi problemi, proponiamo ParallelMuse, un paradigma a due stadi progettato per agenti IS profondi. La prima fase, Functionality-Specified Partial Rollout, suddivide le sequenze generate in regioni funzionali ed esegue il riutilizzo e la diramazione dei percorsi guidati dall'incertezza per migliorare l'efficienza esplorativa. La seconda fase, Compressed Reasoning Aggregation, sfrutta la ridondanza del ragionamento per comprimere senza perdite le informazioni rilevanti per la derivazione della risposta e sintetizzare una risposta finale coerente. Esperimenti condotti su molteplici agenti open-source e benchmark dimostrano un miglioramento delle prestazioni fino al 62% con una riduzione del 10-30% nel consumo di token esplorativi.
English
Parallel thinking expands exploration breadth, complementing the deep
exploration of information-seeking (IS) agents to further enhance
problem-solving capability. However, conventional parallel thinking faces two
key challenges in this setting: inefficiency from repeatedly rolling out from
scratch, and difficulty in integrating long-horizon reasoning trajectories
during answer generation, as limited context capacity prevents full
consideration of the reasoning process. To address these issues, we propose
ParallelMuse, a two-stage paradigm designed for deep IS agents. The first
stage, Functionality-Specified Partial Rollout, partitions generated sequences
into functional regions and performs uncertainty-guided path reuse and
branching to enhance exploration efficiency. The second stage, Compressed
Reasoning Aggregation, exploits reasoning redundancy to losslessly compress
information relevant to answer derivation and synthesize a coherent final
answer. Experiments across multiple open-source agents and benchmarks
demonstrate up to 62% performance improvement with a 10--30% reduction in
exploratory token consumption.