ParallelMuse: Pensamiento Paralelo Agéntico para la Búsqueda Profunda de Información
ParallelMuse: Agentic Parallel Thinking for Deep Information Seeking
October 28, 2025
Autores: Baixuan Li, Dingchu Zhang, Jialong Wu, Wenbiao Yin, Zhengwei Tao, Yida Zhao, Liwen Zhang, Haiyang Shen, Runnan Fang, Pengjun Xie, Jingren Zhou, Yong Jiang
cs.AI
Resumen
El pensamiento paralelo amplía la amplitud de exploración, complementando la exploración profunda de los agentes de búsqueda de información (IS) para mejorar aún más la capacidad de resolución de problemas. Sin embargo, el pensamiento paralelo convencional enfrenta dos desafíos clave en este contexto: la ineficiencia de realizar despliegues repetidos desde cero y la dificultad para integrar trayectorias de razonamiento de largo horizonte durante la generación de respuestas, ya que la capacidad limitada de contexto impide considerar plenamente el proceso de razonamiento. Para abordar estos problemas, proponemos ParallelMuse, un paradigma de dos etapas diseñado para agentes IS profundos. La primera etapa, Despliegue Parcial de Funcionalidad Especificada, divide las secuencias generadas en regiones funcionales y realiza reutilización y ramificación de rutas guiadas por incertidumbre para mejorar la eficiencia exploratoria. La segunda etapa, Agregación de Razonamiento Comprimido, aprovecha la redundancia del razonamiento para comprimir sin pérdidas la información relevante para la derivación de respuestas y sintetizar una respuesta final coherente. Los experimentos en múltiples agentes de código abierto y benchmarks demuestran mejoras de rendimiento de hasta 62% con una reducción del 10-30% en el consumo de tokens exploratorios.
English
Parallel thinking expands exploration breadth, complementing the deep
exploration of information-seeking (IS) agents to further enhance
problem-solving capability. However, conventional parallel thinking faces two
key challenges in this setting: inefficiency from repeatedly rolling out from
scratch, and difficulty in integrating long-horizon reasoning trajectories
during answer generation, as limited context capacity prevents full
consideration of the reasoning process. To address these issues, we propose
ParallelMuse, a two-stage paradigm designed for deep IS agents. The first
stage, Functionality-Specified Partial Rollout, partitions generated sequences
into functional regions and performs uncertainty-guided path reuse and
branching to enhance exploration efficiency. The second stage, Compressed
Reasoning Aggregation, exploits reasoning redundancy to losslessly compress
information relevant to answer derivation and synthesize a coherent final
answer. Experiments across multiple open-source agents and benchmarks
demonstrate up to 62% performance improvement with a 10--30% reduction in
exploratory token consumption.