AgentsNet: Coordinación y Razonamiento Colaborativo en Modelos de Lenguaje de Múltiples Agentes
AgentsNet: Coordination and Collaborative Reasoning in Multi-Agent LLMs
July 11, 2025
Autores: Florian Grötschla, Luis Müller, Jan Tönshoff, Mikhail Galkin, Bryan Perozzi
cs.AI
Resumen
Los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) han demostrado capacidades poderosas para resolver problemas, en particular cuando se organizan en sistemas multiagente. Sin embargo, el surgimiento de tales sistemas también plantea varias preguntas sobre la capacidad de una red compleja de agentes para autoorganizarse y colaborar de manera efectiva. Si bien medir el rendimiento en pruebas estándar de razonamiento indica qué tan bien los sistemas multiagente pueden resolver tareas de razonamiento, no está claro si estos sistemas son capaces de aprovechar su topología de manera efectiva. Aquí proponemos AgentsNet, un nuevo punto de referencia para el razonamiento multiagente. Al inspirarnos en problemas clásicos de sistemas distribuidos y teoría de grafos, AgentsNet mide la capacidad de los sistemas multiagente para formar estrategias colaborativas de resolución de problemas, autoorganización y comunicación efectiva dada una topología de red. Evaluamos una variedad de métodos de referencia en AgentsNet, incluyendo redes homogéneas de agentes que primero deben acordar protocolos básicos para la organización y la comunicación. Encontramos que algunos LLMs de vanguardia ya están demostrando un rendimiento sólido en redes pequeñas, pero comienzan a disminuir una vez que el tamaño de la red escala. Mientras que los puntos de referencia multiagente existentes cubren como máximo 2-5 agentes, AgentsNet es prácticamente ilimitado en tamaño y puede escalar con las nuevas generaciones de LLMs. Por ello, también exploramos modelos de vanguardia en una configuración con hasta 100 agentes.
English
Large-language models (LLMs) have demonstrated powerful problem-solving
capabilities, in particular when organized in multi-agent systems. However, the
advent of such systems also raises several questions on the ability of a
complex network of agents to effectively self-organize and collaborate. While
measuring performance on standard reasoning benchmarks indicates how well
multi-agent systems can solve reasoning tasks, it is unclear whether these
systems are able to leverage their topology effectively. Here, we propose
AgentsNet, a new benchmark for multi-agent reasoning. By drawing inspiration
from classical problems in distributed systems and graph theory, AgentsNet
measures the ability of multi-agent systems to collaboratively form strategies
for problem-solving, self-organization, and effective communication given a
network topology. We evaluate a variety of baseline methods on AgentsNet
including homogeneous networks of agents which first have to agree on basic
protocols for organization and communication. We find that some frontier LLMs
are already demonstrating strong performance for small networks but begin to
fall off once the size of the network scales. While existing multi-agent
benchmarks cover at most 2-5 agents, AgentsNet is practically unlimited in size
and can scale with new generations of LLMs. As such, we also probe frontier
models in a setup with up to 100 agents.