マルチエージェント協調における思考通信
Thought Communication in Multiagent Collaboration
October 23, 2025
著者: Yujia Zheng, Zhuokai Zhao, Zijian Li, Yaqi Xie, Mingze Gao, Lizhu Zhang, Kun Zhang
cs.AI
要旨
自然言語は長らく人間の協力を可能にしてきたが、その非可逆的・曖昧・間接的な性質は集合知の可能性を制限している。機械はこうした制約を受けないにもかかわらず、現在のLLMベースのマルチエージェントシステムの大半は、トークンやその埋め込み値を交換する自然言語への依存を続けている。言語の限界を超えるため、我々は思考通信という新たなパラダイムを提案する。これはテレパシーと同様に、エージェントが心から心へ直接相互作用することを可能にする。これらの潜在思考を原理的に抽出するため、エージェント状態が基盤となる思考の未知関数によって生成される一般潜在変数モデルとして過程を定式化する。非パラメトリック設定において補助情報なしで、任意のエージェント間の共有及び非共有の潜在思考が同定可能であることを証明する。さらに、どのエージェントがどの思考を共有し、これらの関係がどう構造化されるかといった思考共有の大域的構造も、理論的保証付きで回復可能である。確立された理論に基づき、通信前に全エージェントから潜在思考を抽出し、各エージェントに関連思考とその共有パターンを割り当てる枠組みを開発した。このパラダイムはLLMを超えて全てのモダリティに自然に拡張可能である。なぜなら大半の観測データは隠れた生成過程から生じるためである。合成データと実世界ベンチマークによる実験は理論を検証し、思考通信の協調的優位性を実証した。表面レベルの観測だけでは、計算資源やデータ規模に関わらず解決不能な課題が数多く存在することを踏まえ、本研究成果が隠れた世界を活用する可能性を照らす一助となることを期待する。
English
Natural language has long enabled human cooperation, but its lossy,
ambiguous, and indirect nature limits the potential of collective intelligence.
While machines are not subject to these constraints, most LLM-based multi-agent
systems still rely solely on natural language, exchanging tokens or their
embeddings. To go beyond language, we introduce a new paradigm, thought
communication, which enables agents to interact directly mind-to-mind, akin to
telepathy. To uncover these latent thoughts in a principled way, we formalize
the process as a general latent variable model, where agent states are
generated by an unknown function of underlying thoughts. We prove that, in a
nonparametric setting without auxiliary information, both shared and private
latent thoughts between any pair of agents can be identified. Moreover, the
global structure of thought sharing, including which agents share which
thoughts and how these relationships are structured, can also be recovered with
theoretical guarantees. Guided by the established theory, we develop a
framework that extracts latent thoughts from all agents prior to communication
and assigns each agent the relevant thoughts, along with their sharing
patterns. This paradigm naturally extends beyond LLMs to all modalities, as
most observational data arise from hidden generative processes. Experiments on
both synthetic and real-world benchmarks validate the theory and demonstrate
the collaborative advantages of thought communication. We hope this work
illuminates the potential of leveraging the hidden world, as many challenges
remain unsolvable through surface-level observation alone, regardless of
compute or data scale.