LedgerAgent: Strukturierter Zustand für richtlinienkonforme Werkzeug-aufrufende Agenten

Zusammenfassung

Richtlinienkonforme Tool-Calling-Agenten in Kundendienstbereichen müssen Aufgabenzustände über mehrere Gesprächsrunden hinweg aufrechterhalten, während sie Werkzeuge aufrufen, und dabei Bereichsrichtlinien befolgen. Aufgabenzustände bestehen aus relevanten Fakten, Identifikatoren, Einschränkungen und Bedingungen, die durch Benutzerinteraktionen und Tool-Aufrufe beobachtet werden. Bei Standard-Agenten werden Aufgabenzustände nicht separat dargestellt. Beobachtungen, Tool-Rückgaben und Richtlinienanweisungen werden in den Prompt eingefügt, sodass die Agenten jedes Mal, wenn sie entscheiden, was als Nächstes zu tun ist, die relevanten Zustände aus dem Prompt rekonstruieren müssen. Dieses Design macht die Zustandsverwaltung implizit und führt zu zwei häufigen Fehlermodi. Ein Agent kann die richtigen Fakten abrufen, seine Entscheidung aber später auf veraltete, fehlende oder falsche Informationen stützen; und ein syntaktisch gültiger Tool-Aufruf kann dennoch eine Bereichsrichtlinie verletzen, die vom aktuellen Aufgabenzustand abhängt. Wir stellen LedgerAgent vor, eine Inferenzzeit-Methode für Tool-Calling-Agenten, die beobachtete Aufgabenzustände in einem separaten Ledger verwaltet und die Zustände in den Prompt einfügt. Das Ledger wird auch verwendet, um zustandsabhängige Richtlinieneinschränkungen zu überprüfen, bevor umgebungsverändernde Tool-Aufrufe ausgeführt werden, wodurch Richtlinienverstöße verhindert werden. In vier Kundendienstbereichen und einem gemischten Panel aus Open- und Closed-Weight-Modellen verbessert LedgerAgent die durchschnittliche Pass@k-Rate gegenüber einem standardmäßigen promptbasierten Tool-Calling-Ansatz, wobei die größten Verbesserungen unter strengeren Metriken zur Konsistenz über mehrere Versuche erzielt werden.

English

Policy-adherent tool-calling agents in customer-service domains must maintain task states across turns while calling tools and obeying domain policies. Task states consist of relevant facts, identifiers, constraints, and conditions observed through user interaction and tool calls. In standard agents, task states are not represented separately. Observations, tool returns, and policy instructions are placed in the prompt, leaving agents to reconstruct the relevant states from the prompt each time they decide what to do next. This design makes state management implicit, creating two common failure modes. An agent may retrieve the right facts but later ground its decision in stale, missing, or incorrect information; and a syntactically valid tool call may still violate a domain policy that depends on the current task state. We introduce LedgerAgent, an inference-time method for tool-calling agents that maintains observed task states in a separate ledger and renders the states into the prompt. The ledger is also used to check state-dependent policy constraints before environment-changing tool calls are executed, blocking policy violations. Across four customer-service domains and a mixed panel of open- and closed-weight models, LedgerAgent improves average passk over a standard prompt-based tool-calling approach, with the largest gains under stricter multi-trial consistency metrics.