LedgerAgent : État structuré pour des agents d'appel d'outils conformes aux politiques

Résumé

Les agents appelant des outils et respectant les politiques dans les domaines du service client doivent maintenir les états de tâche d'un tour à l'autre tout en exécutant des appels d'outils et en obéissant aux politiques du domaine. Les états de tâche sont constitués de faits pertinents, d'identifiants, de contraintes et de conditions observés lors des interactions avec l'utilisateur et des appels d'outils. Dans les agents standards, les états de tâche ne sont pas représentés séparément. Les observations, les retours d'outils et les instructions de politique sont placés dans le prompt, obligeant les agents à reconstruire les états pertinents à partir du prompt à chaque décision de l'action suivante. Cette conception rend la gestion des états implicite, créant deux modes de défaillance courants. Un agent peut récupérer les bons faits mais fonder ultérieurement sa décision sur des informations obsolètes, manquantes ou incorrectes ; et un appel d'outil syntaxiquement valide peut néanmoins violer une politique du domaine qui dépend de l'état de tâche actuel. Nous présentons LedgerAgent, une méthode au moment de l'inférence pour les agents appelant des outils, qui maintient les états de tâche observés dans un registre séparé et intègre ces états dans le prompt. Le registre est également utilisé pour vérifier les contraintes de politique dépendant de l'état avant l'exécution des appels d'outils modifiant l'environnement, bloquant ainsi les violations de politique. À travers quatre domaines de service client et un panel mixte de modèles ouverts et fermés, LedgerAgent améliore le passk moyen par rapport à une approche standard d'appel d'outils basée sur le prompt, avec les gains les plus importants sous des métriques de cohérence multi-essai plus strictes.

English

Policy-adherent tool-calling agents in customer-service domains must maintain task states across turns while calling tools and obeying domain policies. Task states consist of relevant facts, identifiers, constraints, and conditions observed through user interaction and tool calls. In standard agents, task states are not represented separately. Observations, tool returns, and policy instructions are placed in the prompt, leaving agents to reconstruct the relevant states from the prompt each time they decide what to do next. This design makes state management implicit, creating two common failure modes. An agent may retrieve the right facts but later ground its decision in stale, missing, or incorrect information; and a syntactically valid tool call may still violate a domain policy that depends on the current task state. We introduce LedgerAgent, an inference-time method for tool-calling agents that maintains observed task states in a separate ledger and renders the states into the prompt. The ledger is also used to check state-dependent policy constraints before environment-changing tool calls are executed, blocking policy violations. Across four customer-service domains and a mixed panel of open- and closed-weight models, LedgerAgent improves average passk over a standard prompt-based tool-calling approach, with the largest gains under stricter multi-trial consistency metrics.