ChatPaper.aiChatPaper

GraphTracer: Grafisch geleid foutopsporing in LLM-agenten voor robuuste meerronde diepgaande zoekopdrachten

GraphTracer: Graph-Guided Failure Tracing in LLM Agents for Robust Multi-Turn Deep Search

October 12, 2025
Auteurs: Heng Zhang, Yuling Shi, Xiaodong Gu, Haochen You, Zijian Zhang, Lubin Gan, Yilei Yuan, Jin Huang
cs.AI

Samenvatting

Multi-agent systemen aangedreven door Large Language Models blinken uit in complexe taken door gecoördineerde samenwerking, maar kampen met hoge foutpercentages in multi-turn diepe zoekscenario's. Bestaande temporele attributiemethoden hebben moeite om de oorzaken nauwkeurig te diagnosticeren, vooral wanneer fouten zich verspreiden over meerdere agents. Pogingen om foutattributie te automatiseren door het analyseren van actievolgordes blijven ineffectief vanwege hun onvermogen om rekening te houden met informatieafhankelijkheden die agents overspannen. Dit artikel identificeert twee kernuitdagingen: (i) het onderscheiden van symptomen van oorzaken in multi-agent foutpropagatie, en (ii) het traceren van informatieafhankelijkheden verder dan temporele volgorde. Om deze problemen aan te pakken, introduceren we GraphTracer, een framework dat foutattributie herdefinieert door middel van informatieflowanalyse. GraphTracer construeert Information Dependency Graphs (IDG's) om expliciet vast te leggen hoe agents verwijzen naar en voortbouwen op eerdere uitvoer. Het lokaliseert oorzaken door door deze afhankelijkheidsstructuren te traceren in plaats van te vertrouwen op temporele sequenties. GraphTracer gebruikt ook grafiekbewuste synthetische datageneratie om kritieke nodes te targeten, waardoor realistische foutscenario's worden gecreëerd. Evaluaties op de Who\&When-benchmark en integratie in productiesystemen tonen aan dat GraphTracer-8B tot 18,18\% hogere attributienauwkeurigheid bereikt in vergelijking met state-of-the-art modellen en een prestatieverbetering van 4,8\% tot 14,2\% mogelijk maakt in geïmplementeerde multi-agent frameworks, waarmee een robuuste oplossing voor debugging van multi-agent systemen wordt gevestigd.
English
Multi-agent systems powered by Large Language Models excel at complex tasks through coordinated collaboration, yet they face high failure rates in multi-turn deep search scenarios. Existing temporal attribution methods struggle to accurately diagnose root causes, particularly when errors propagate across multiple agents. Attempts to automate failure attribution by analyzing action sequences remain ineffective due to their inability to account for information dependencies that span agents. This paper identifies two core challenges: (i) distinguishing symptoms from root causes in multi-agent error propagation, and (ii) tracing information dependencies beyond temporal order. To address these issues, we introduce GraphTracer, a framework that redefines failure attribution through information flow analysis. GraphTracer constructs Information Dependency Graphs (IDGs) to explicitly capture how agents reference and build on prior outputs. It localizes root causes by tracing through these dependency structures instead of relying on temporal sequences. GraphTracer also uses graph-aware synthetic data generation to target critical nodes, creating realistic failure scenarios. Evaluations on the Who\&When benchmark and integration into production systems demonstrate that GraphTracer-8B achieves up to 18.18\% higher attribution accuracy compared to state-of-the-art models and enables 4.8\% to 14.2\% performance improvements in deployed multi-agent frameworks, establishing a robust solution for multi-agent system debugging.
PDF22October 16, 2025