GraphTracer : Traçage des échecs guidé par graphe dans les agents LLM pour une recherche approfondie robuste en tours multiples

papers.abstract

Les systèmes multi-agents alimentés par des modèles de langage de grande taille excellent dans les tâches complexes grâce à une collaboration coordonnée, mais ils rencontrent des taux d'échec élevés dans les scénarios de recherche approfondie à tours multiples. Les méthodes existantes d'attribution temporelle peinent à diagnostiquer avec précision les causes racines, en particulier lorsque les erreurs se propagent à travers plusieurs agents. Les tentatives d'automatisation de l'attribution des échecs par l'analyse des séquences d'actions restent inefficaces en raison de leur incapacité à prendre en compte les dépendances informationnelles qui s'étendent sur plusieurs agents. Cet article identifie deux défis majeurs : (i) distinguer les symptômes des causes racines dans la propagation d'erreurs multi-agents, et (ii) retracer les dépendances informationnelles au-delà de l'ordre temporel. Pour résoudre ces problèmes, nous introduisons GraphTracer, un cadre qui redéfinit l'attribution des échecs par l'analyse des flux d'information. GraphTracer construit des graphes de dépendance informationnelle (IDG) pour capturer explicitement comment les agents se réfèrent et s'appuient sur les sorties précédentes. Il localise les causes racines en retraçant ces structures de dépendance plutôt qu'en s'appuyant sur des séquences temporelles. GraphTracer utilise également une génération synthétique de données basée sur les graphes pour cibler les nœuds critiques, créant ainsi des scénarios d'échec réalistes. Les évaluations sur le benchmark Who\&When et l'intégration dans des systèmes de production démontrent que GraphTracer-8B atteint une précision d'attribution jusqu'à 18,18 % supérieure par rapport aux modèles de pointe et permet des améliorations de performance de 4,8 % à 14,2 % dans les cadres multi-agents déployés, établissant ainsi une solution robuste pour le débogage des systèmes multi-agents.

English

Multi-agent systems powered by Large Language Models excel at complex tasks through coordinated collaboration, yet they face high failure rates in multi-turn deep search scenarios. Existing temporal attribution methods struggle to accurately diagnose root causes, particularly when errors propagate across multiple agents. Attempts to automate failure attribution by analyzing action sequences remain ineffective due to their inability to account for information dependencies that span agents. This paper identifies two core challenges: (i) distinguishing symptoms from root causes in multi-agent error propagation, and (ii) tracing information dependencies beyond temporal order. To address these issues, we introduce GraphTracer, a framework that redefines failure attribution through information flow analysis. GraphTracer constructs Information Dependency Graphs (IDGs) to explicitly capture how agents reference and build on prior outputs. It localizes root causes by tracing through these dependency structures instead of relying on temporal sequences. GraphTracer also uses graph-aware synthetic data generation to target critical nodes, creating realistic failure scenarios. Evaluations on the Who\&When benchmark and integration into production systems demonstrate that GraphTracer-8B achieves up to 18.18\% higher attribution accuracy compared to state-of-the-art models and enables 4.8\% to 14.2\% performance improvements in deployed multi-agent frameworks, establishing a robust solution for multi-agent system debugging.

GraphTracer : Traçage des échecs guidé par graphe dans les agents LLM pour une recherche approfondie robuste en tours multiples

GraphTracer: Graph-Guided Failure Tracing in LLM Agents for Robust Multi-Turn Deep Search

papers.abstract

Support