AgensFlow: Ein Koordinationsrichtlinien-Substrat für Multi-Agenten-Systeme

Zusammenfassung

Multiagentensysteme, die auf großen Sprachmodellen (LLMs) basieren, erfordern viele Koordinationsentscheidungen, die schwer a priori festzulegen sind: welches Fähigkeitsprotokoll aufgerufen werden soll, welche Agentenrolle eine Teilaufgabe übernehmen soll, welches Modell an jede Rolle gebunden werden soll, wie Rollen interagieren sollen, wann Abruf oder Verifikation eingesetzt werden soll und wann ein Schritt vollständig ausgelassen werden soll. Diese Entscheidungen interagieren mit dem Aufgabenregime und operativen Beschränkungen, sodass statische Pipelines und einmalige Modellvergleiche nur eine begrenzte Sicht auf den Entwurfsraum bieten. Dieses Papier führt AgensFlow ein, ein Open-Source-Framework, das Multiagentenkoordination als ein Problem des Online-Policy-Lernens unter partieller Beobachtbarkeit behandelt. Das Framework macht Koordinationsentscheidungen beobachtbar und aus wiederholten Trajektorien lernbar, anstatt Fähigkeits-, Rollen-, Modell-, Topologie- und Bewertungsentscheidungen als feste Pipelinegestaltung zu behandeln. AgensFlow wird an zwei Korpora evaluiert: Aufgaben zu Vorfällen in verteilten Systemen und Aufgaben zu Sicherheitshinweisen. Die Evaluierung zeigt drei Hauptergebnisse: Erlerntes Routing erreicht einen Betriebspunkt höherer Qualität als eine feste Pipeline-Baseline bei koordinationsintensiven Klassen; skip:X isoliert die Topologiekompression als einen bedeutenden Teil des Substrats; und warmgestartete Policy-Graphen können die Erkundungskosten reduzieren, während sie die Plateauqualität bewahren. Insgesamt unterstützen die Ergebnisse, dass erlerntes, nachvollziehbares Routing koordinationsintensive Multiagenten-Workflows gegenüber statischer Verdrahtung verbessern kann.

English

Multi-agent systems built on large language models (LLMs) require many coordination choices that are difficult to fix a priori: which skill protocol to invoke, which agent role should perform a subtask, which model to bind to each role, how roles should interact, when to use retrieval or verification, and when to omit a step entirely. These choices interact with task regime and operational constraints, so static pipelines and one-off model comparisons provide only a limited view of the design space. This paper introduces AgensFlow, an open-source framework that treats multi-agent coordination as an online policy-learning problem under partial observability. The framework makes coordination decisions observable and learnable from repeated trajectories, rather than treating skill, role, model, topology, and evaluation choices as fixed pipeline design. AgensFlow is evaluated on two corpora: distributed-systems incident tasks and security-advisory tasks. The evaluation shows three main results: learned routing reaches a higher-quality operating point than a fixed pipeline baseline on coordination-heavy classes; skip:X isolates topology compression as a meaningful part of the substrate; and warm-started policy graphs can reduce exploration cost while preserving plateau quality. Overall, the results support that learned, auditable routing can improve coordination-heavy multi-agent workflows over static wiring.