ParallelMuse: Агентное параллельное мышление для глубокого информационного поиска
ParallelMuse: Agentic Parallel Thinking for Deep Information Seeking
October 28, 2025
Авторы: Baixuan Li, Dingchu Zhang, Jialong Wu, Wenbiao Yin, Zhengwei Tao, Yida Zhao, Liwen Zhang, Haiyang Shen, Runnan Fang, Pengjun Xie, Jingren Zhou, Yong Jiang
cs.AI
Аннотация
Параллельное мышление расширяет широту исследования, дополняя глубокое изучение агентов поиска информации (ПИ) для дальнейшего повышения способности к решению задач. Однако традиционное параллельное мышление сталкивается в этой среде с двумя ключевыми проблемами: неэффективностью из-за многократного запуска с нуля и сложностью интеграции траекторий рассуждений длительного горизонта в процессе генерации ответа, поскольку ограниченная ёмкость контекста препятствует полному учёту процесса рассуждений. Для решения этих проблем мы предлагаем ParallelMuse — двухэтапную парадигму, разработанную для глубоких ПИ-агентов. На первом этапе, Функционально-Специфицированное Частичное Развёртывание, сгенерированные последовательности разделяются на функциональные области с выполнением повторного использования и ветвления путей под управлением неопределённости для повышения эффективности исследования. На втором этапе, Агрегация Сжатых Рассуждений, используется избыточность рассуждений для безпотерьного сжатия информации, релевантной для вывода ответа, и синтеза согласованного итогового ответа. Эксперименты на множестве открытых агентов и бенчмарков демонстрируют до 62% улучшения производительности при сокращении потребления исследовательских токенов на 10–30%.
English
Parallel thinking expands exploration breadth, complementing the deep
exploration of information-seeking (IS) agents to further enhance
problem-solving capability. However, conventional parallel thinking faces two
key challenges in this setting: inefficiency from repeatedly rolling out from
scratch, and difficulty in integrating long-horizon reasoning trajectories
during answer generation, as limited context capacity prevents full
consideration of the reasoning process. To address these issues, we propose
ParallelMuse, a two-stage paradigm designed for deep IS agents. The first
stage, Functionality-Specified Partial Rollout, partitions generated sequences
into functional regions and performs uncertainty-guided path reuse and
branching to enhance exploration efficiency. The second stage, Compressed
Reasoning Aggregation, exploits reasoning redundancy to losslessly compress
information relevant to answer derivation and synthesize a coherent final
answer. Experiments across multiple open-source agents and benchmarks
demonstrate up to 62% performance improvement with a 10--30% reduction in
exploratory token consumption.