Sistemas Multiagente Descentralizados con Contexto Compartido

Resumen

Los sistemas multiagente (SMA) pueden escalar el razonamiento de modelos de lenguaje grandes en tiempo de prueba al descomponer problemas complejos en subtareas paralelas. Sin embargo, la mayoría de los SMA existentes dependen de una orquestación centralizada, donde un agente principal asigna trabajo, recopila resultados y fusiona las salidas. A medida que crece el número de subtareas, este controlador se convierte en un cuello de botella tanto en comunicación como en integración. Proponemos Modelos de Lenguaje Descentralizados (DeLM), un marco de SMA que descentraliza la coordinación mediante agentes paralelos, un contexto verificado compartido y una cola de tareas. Los agentes reclaman subtareas de forma asíncrona, leen el progreso acumulado, realizan razonamiento local y escriben actualizaciones verificadas compactas. El contexto compartido actúa como un sustrato de comunicación común, permitiendo que los agentes se basen en el progreso verificado de otros sin tener que enrutar cada actualización a través de un controlador central. Empíricamente, DeLM mejora tanto el escalamiento en tiempo de prueba en ingeniería de software como el razonamiento en contexto largo. En SWE-bench Verified, DeLM logra el mejor rendimiento en Avg.@1, Pass@2 y Pass@4, con ganancias de hasta 10.5 puntos porcentuales sobre el modelo base más fuerte, al tiempo que reduce el costo por tarea en aproximadamente un 50%. En LongBench-v2 Multi-Doc QA, DeLM alcanza la mayor precisión promedio entre cuatro familias de modelos de vanguardia, mejorando hasta 5.7 puntos porcentuales respecto al modelo base más fuerte. El código está disponible en nuestro sitio web del proyecto: https://yuzhenmao.github.io/DeLM/.

English

Multi-agent systems (MAS) can scale large language model reasoning at test time by decomposing complex problems into parallel subtasks. However, most existing MAS rely on centralized orchestration, where a main agent assigns work, collects outputs, and merges results. As the number of subtasks grows, this controller becomes a communication and integration bottleneck. We propose Decentralized Language Models (DeLM), a MAS framework that decentralizes coordination through parallel agents, a shared verified context, and a task queue. Agents asynchronously claim subtasks, read accumulated progress, perform local reasoning, and write back compact verified updates. The shared context acts as a common communication substrate, enabling agents to build on one another's verified progress without routing every update through a central controller. Empirically, DeLM improves both software-engineering test-time scaling and long-context reasoning. On SWE-bench Verified, DeLM achieves the best performance across Avg.@1, Pass@2, and Pass@4, with gains of up to 10.5 percentage points over the strongest baseline, while reducing cost per task by roughly 50%. On LongBench-v2 Multi-Doc QA, DeLM achieves the highest average accuracy across four frontier model families, improving over the strongest baseline by up to 5.7 percentage points. The code is available on our project website at https://yuzhenmao.github.io/DeLM/.