GraphTracer : Traçage des échecs guidé par graphe dans les agents LLM pour une recherche approfondie robuste en tours multiples
GraphTracer: Graph-Guided Failure Tracing in LLM Agents for Robust Multi-Turn Deep Search
October 12, 2025
papers.authors: Heng Zhang, Yuling Shi, Xiaodong Gu, Haochen You, Zijian Zhang, Lubin Gan, Yilei Yuan, Jin Huang
cs.AI
papers.abstract
Les systèmes multi-agents alimentés par des modèles de langage de grande taille excellent dans les tâches complexes grâce à une collaboration coordonnée, mais ils rencontrent des taux d'échec élevés dans les scénarios de recherche approfondie à tours multiples. Les méthodes existantes d'attribution temporelle peinent à diagnostiquer avec précision les causes racines, en particulier lorsque les erreurs se propagent à travers plusieurs agents. Les tentatives d'automatisation de l'attribution des échecs par l'analyse des séquences d'actions restent inefficaces en raison de leur incapacité à prendre en compte les dépendances informationnelles qui s'étendent sur plusieurs agents. Cet article identifie deux défis majeurs : (i) distinguer les symptômes des causes racines dans la propagation d'erreurs multi-agents, et (ii) retracer les dépendances informationnelles au-delà de l'ordre temporel. Pour résoudre ces problèmes, nous introduisons GraphTracer, un cadre qui redéfinit l'attribution des échecs par l'analyse des flux d'information. GraphTracer construit des graphes de dépendance informationnelle (IDG) pour capturer explicitement comment les agents se réfèrent et s'appuient sur les sorties précédentes. Il localise les causes racines en retraçant ces structures de dépendance plutôt qu'en s'appuyant sur des séquences temporelles. GraphTracer utilise également une génération synthétique de données basée sur les graphes pour cibler les nœuds critiques, créant ainsi des scénarios d'échec réalistes. Les évaluations sur le benchmark Who\&When et l'intégration dans des systèmes de production démontrent que GraphTracer-8B atteint une précision d'attribution jusqu'à 18,18 % supérieure par rapport aux modèles de pointe et permet des améliorations de performance de 4,8 % à 14,2 % dans les cadres multi-agents déployés, établissant ainsi une solution robuste pour le débogage des systèmes multi-agents.
English
Multi-agent systems powered by Large Language Models excel at complex tasks
through coordinated collaboration, yet they face high failure rates in
multi-turn deep search scenarios. Existing temporal attribution methods
struggle to accurately diagnose root causes, particularly when errors propagate
across multiple agents. Attempts to automate failure attribution by analyzing
action sequences remain ineffective due to their inability to account for
information dependencies that span agents. This paper identifies two core
challenges: (i) distinguishing symptoms from root causes in multi-agent
error propagation, and (ii) tracing information dependencies beyond
temporal order. To address these issues, we introduce GraphTracer, a
framework that redefines failure attribution through information flow analysis.
GraphTracer constructs Information Dependency Graphs (IDGs) to explicitly
capture how agents reference and build on prior outputs. It localizes root
causes by tracing through these dependency structures instead of relying on
temporal sequences. GraphTracer also uses graph-aware synthetic data generation
to target critical nodes, creating realistic failure scenarios. Evaluations on
the Who\&When benchmark and integration into production systems demonstrate
that GraphTracer-8B achieves up to 18.18\% higher attribution accuracy compared
to state-of-the-art models and enables 4.8\% to 14.2\% performance improvements
in deployed multi-agent frameworks, establishing a robust solution for
multi-agent system debugging.