LedgerAgent: Gestructureerde toestand voor beleidsconforme tool-aanroepende agenten

Samenvatting

Beleidsgetrouwe tool-aanroepagenten in klantenservicedomeinen moeten taaktoestanden over meerdere beurten heen behouden terwijl ze tools aanroepen en moeten zich houden aan domeinbeleid. Taaktoestanden bestaan uit relevante feiten, identificatoren, beperkingen en voorwaarden die worden waargenomen via gebruikersinteractie en toolaanroepen. In standaardagenten worden taaktoestanden niet afzonderlijk weergegeven. Waarnemingen, toolresultaten en beleidsinstructies worden in de prompt geplaatst, waardoor agenten elke keer dat ze moeten beslissen wat ze vervolgens doen, de relevante toestanden uit de prompt moeten reconstrueren. Dit ontwerp maakt toestandsbeheer impliciet, wat leidt tot twee veelvoorkomende faalwijzen. Een agent kan de juiste feiten ophalen, maar zijn beslissing later baseren op verouderde, ontbrekende of onjuiste informatie; en een syntactisch geldige toolaanroep kan nog steeds een domeinbeleid schenden dat afhangt van de huidige taaktoestand. We introduceren LedgerAgent, een inferentietijdmethode voor tool-aanroepagenten die waargenomen taaktoestanden in een apart register bijhoudt en de toestanden in de prompt weergeeft. Het register wordt ook gebruikt om toestandsafhankelijke beleidsbeperkingen te controleren voordat omgevingsveranderende toolaanroepen worden uitgevoerd, waardoor beleidsschendingen worden voorkomen. In vier klantenservicedomeinen en een gemengd panel van open- en gesloten gewichtsmodellen verbetert LedgerAgent de gemiddelde passk ten opzichte van een standaard promptgebaseerde tool-aanroepbenadering, met de grootste winst onder strengere consistentiemetrieken over meerdere pogingen.

English

Policy-adherent tool-calling agents in customer-service domains must maintain task states across turns while calling tools and obeying domain policies. Task states consist of relevant facts, identifiers, constraints, and conditions observed through user interaction and tool calls. In standard agents, task states are not represented separately. Observations, tool returns, and policy instructions are placed in the prompt, leaving agents to reconstruct the relevant states from the prompt each time they decide what to do next. This design makes state management implicit, creating two common failure modes. An agent may retrieve the right facts but later ground its decision in stale, missing, or incorrect information; and a syntactically valid tool call may still violate a domain policy that depends on the current task state. We introduce LedgerAgent, an inference-time method for tool-calling agents that maintains observed task states in a separate ledger and renders the states into the prompt. The ledger is also used to check state-dependent policy constraints before environment-changing tool calls are executed, blocking policy violations. Across four customer-service domains and a mixed panel of open- and closed-weight models, LedgerAgent improves average passk over a standard prompt-based tool-calling approach, with the largest gains under stricter multi-trial consistency metrics.