AUDITFLOW: Ambientes Simbólicos Executáveis para Verificação de Relatórios Financeiros Estruturados

Resumo

A verificação estruturada de auditoria financeira é desafiadora para agentes baseados em modelos de linguagem porque a correção depende de evidências estruturadas, e não apenas de texto. Um modelo deve vincular fatos relatados a conceitos de taxonomia, percorrer relações de cálculo ou dimensionais e recalcular valores esperados antes de aplicar uma regra de auditoria. Propomos o AuditFlow, uma estrutura multiagente fundamentada em grafos que separa a busca adaptativa da verificação determinística. O AuditFlow constrói um ambiente simbólico a partir de um grafo estático da taxonomia US-GAAP e um grafo dinâmico de arquivos XBRL, expondo-os por meio de ferramentas tipadas para recuperação de fatos, navegação por taxonomia, verificação numérica e avaliação de regras. Dois auditores juniores inspecionam cada caso sob perspectivas regulatória e probatória, enquanto um auditor sênior resolve divergências e pode solicitar investigações adicionais. Os relatórios finais são fundidos por meio de agregação de evidências para produzir um veredito de auditoria, valor esperado, trilha de evidências e pontuação de confiabilidade. Em uma amostra FinMR derivada do FinAuditing, o AuditFlow atinge 82,09% de precisão conjunta de auditoria com GPT-5.5, superando a linha de base mais forte em 14,93 pontos. A remoção das verificações determinísticas reduz a precisão para 17,91%, demonstrando que o ambiente simbólico realiza a etapa de verificação que o modelo não consegue substituir de forma confiável.

English

Structured financial audit verification is difficult for language-model agents because correctness depends on structured evidence rather than text alone. A model must link reported facts to taxonomy concepts, traverse calculation or dimensional relations, and recompute expected values before applying an audit rule. We propose AuditFlow, a graph-grounded multi-agent framework that separates adaptive search from deterministic verification. AuditFlow builds a symbolic environment from a static US-GAAP taxonomy graph and a dynamic XBRL filing graph, and exposes it through typed tools for fact retrieval, taxonomy traversal, numerical checking, and rule evaluation. Two junior auditors inspect each case from regulatory and evidentiary views, while a senior auditor resolves disagreements and can request further investigation. The final reports are fused through evidential aggregation to produce an audit verdict, expected value, evidence trail, and trustworthiness score. On a FinAuditing-derived FinMR sample, AuditFlow reaches 82.09% joint audit accuracy under GPT-5.5, outperforming the strongest baseline by 14.93 points. Removing deterministic checks drops accuracy to 17.91%, showing that the symbolic environment performs the verification step that the model cannot reliably replace.