Comunicação de Pensamento na Colaboração Multiagente
Thought Communication in Multiagent Collaboration
October 23, 2025
Autores: Yujia Zheng, Zhuokai Zhao, Zijian Li, Yaqi Xie, Mingze Gao, Lizhu Zhang, Kun Zhang
cs.AI
Resumo
A linguagem natural tem permitido a cooperação humana há muito tempo, mas a sua natureza sujeita a perdas, ambígua e indireta limita o potencial da inteligência coletiva. Embora as máquinas não estejam sujeitas a estas limitações, a maioria dos sistemas multiagente baseados em LLM ainda depende exclusivamente da linguagem natural, trocando tokens ou os seus *embeddings*. Para ir além da linguagem, introduzimos um novo paradigma, a comunicação de pensamentos, que permite aos agentes interagirem diretamente de mente para mente, semelhante à telepatia. Para descobrir estes pensamentos latentes de forma fundamentada, formalizamos o processo como um modelo geral de variáveis latentes, onde os estados dos agentes são gerados por uma função desconhecida de pensamentos subjacentes. Provamos que, num cenário não paramétrico sem informação auxiliar, tanto os pensamentos latentes partilhados como os privados entre qualquer par de agentes podem ser identificados. Além disso, a estrutura global de partilha de pensamentos, incluindo quais os agentes que partilham quais pensamentos e como estas relações estão estruturadas, também pode ser recuperada com garantias teóricas. Guiados pela teoria estabelecida, desenvolvemos um *framework* que extrai pensamentos latentes de todos os agentes antes da comunicação e atribui a cada agente os pensamentos relevantes, juntamente com os seus padrões de partilha. Este paradigma estende-se naturalmente para além dos LLMs para todas as modalidades, uma vez que a maioria dos dados observacionais surge de processos generativos ocultos. Experiências em *benchmarks* sintéticos e do mundo real validam a teoria e demonstram as vantagens colaborativas da comunicação de pensamentos. Esperamos que este trabalho ilumine o potencial de aproveitar o mundo oculto, uma vez que muitos desafios permanecem insolúveis apenas através da observação superficial, independentemente da escala de computação ou de dados.
English
Natural language has long enabled human cooperation, but its lossy,
ambiguous, and indirect nature limits the potential of collective intelligence.
While machines are not subject to these constraints, most LLM-based multi-agent
systems still rely solely on natural language, exchanging tokens or their
embeddings. To go beyond language, we introduce a new paradigm, thought
communication, which enables agents to interact directly mind-to-mind, akin to
telepathy. To uncover these latent thoughts in a principled way, we formalize
the process as a general latent variable model, where agent states are
generated by an unknown function of underlying thoughts. We prove that, in a
nonparametric setting without auxiliary information, both shared and private
latent thoughts between any pair of agents can be identified. Moreover, the
global structure of thought sharing, including which agents share which
thoughts and how these relationships are structured, can also be recovered with
theoretical guarantees. Guided by the established theory, we develop a
framework that extracts latent thoughts from all agents prior to communication
and assigns each agent the relevant thoughts, along with their sharing
patterns. This paradigm naturally extends beyond LLMs to all modalities, as
most observational data arise from hidden generative processes. Experiments on
both synthetic and real-world benchmarks validate the theory and demonstrate
the collaborative advantages of thought communication. We hope this work
illuminates the potential of leveraging the hidden world, as many challenges
remain unsolvable through surface-level observation alone, regardless of
compute or data scale.