ChatPaper.aiChatPaper

GraphTracer: グラフ誘導型失敗追跡によるLLMエージェントのロバストな多ターン深層検索

GraphTracer: Graph-Guided Failure Tracing in LLM Agents for Robust Multi-Turn Deep Search

October 12, 2025
著者: Heng Zhang, Yuling Shi, Xiaodong Gu, Haochen You, Zijian Zhang, Lubin Gan, Yilei Yuan, Jin Huang
cs.AI

要旨

大規模言語モデルを基盤とするマルチエージェントシステムは、協調的な連携を通じて複雑なタスクに優れた性能を発揮するが、多段階の深い探索シナリオでは高い失敗率に直面している。既存の時間的帰属手法は、特にエラーが複数のエージェントに伝播する場合に根本原因を正確に診断することが困難である。行動シーケンスを分析することで失敗の帰属を自動化しようとする試みも、エージェント間の情報依存関係を考慮できないため、効果的ではない。本論文では、二つの核心的な課題を特定する:(i) マルチエージェントのエラー伝播において症状と根本原因を区別すること、(ii) 時間的順序を超えた情報依存関係を追跡すること。これらの課題に対処するため、我々は情報フロー分析を通じて失敗の帰属を再定義するフレームワークであるGraphTracerを提案する。GraphTracerは、情報依存グラフ(IDG)を構築し、エージェントがどのように以前の出力を参照し、それに基づいて構築するかを明示的に捕捉する。これにより、時間的シーケンスに依存するのではなく、これらの依存構造を追跡することで根本原因を特定する。さらに、GraphTracerはグラフを意識した合成データ生成を用いて重要なノードをターゲットとし、現実的な失敗シナリオを作成する。Who\&Whenベンチマークでの評価および生産システムへの統合により、GraphTracer-8Bは最先端のモデルと比較して最大18.18\%高い帰属精度を達成し、展開されたマルチエージェントフレームワークにおいて4.8\%から14.2\%の性能向上を実現し、マルチエージェントシステムのデバッグに対する堅牢なソリューションを確立する。
English
Multi-agent systems powered by Large Language Models excel at complex tasks through coordinated collaboration, yet they face high failure rates in multi-turn deep search scenarios. Existing temporal attribution methods struggle to accurately diagnose root causes, particularly when errors propagate across multiple agents. Attempts to automate failure attribution by analyzing action sequences remain ineffective due to their inability to account for information dependencies that span agents. This paper identifies two core challenges: (i) distinguishing symptoms from root causes in multi-agent error propagation, and (ii) tracing information dependencies beyond temporal order. To address these issues, we introduce GraphTracer, a framework that redefines failure attribution through information flow analysis. GraphTracer constructs Information Dependency Graphs (IDGs) to explicitly capture how agents reference and build on prior outputs. It localizes root causes by tracing through these dependency structures instead of relying on temporal sequences. GraphTracer also uses graph-aware synthetic data generation to target critical nodes, creating realistic failure scenarios. Evaluations on the Who\&When benchmark and integration into production systems demonstrate that GraphTracer-8B achieves up to 18.18\% higher attribution accuracy compared to state-of-the-art models and enables 4.8\% to 14.2\% performance improvements in deployed multi-agent frameworks, establishing a robust solution for multi-agent system debugging.
PDF32February 7, 2026