L'absorption de la complexité : un harnais de connaissances interaction-natif pour les agents LLM financiers

Résumé

Les agents IA financiers échouent souvent pour une raison simple : ils font porter la complexité aux utilisateurs. Un utilisateur doit sans cesse reformuler ses objectifs, préférences de risque, contexte de portefeuille, jugements passés et hypothèses de marché changeantes, tandis que l'agent répond, récupère, agit et oublie. En finance, cela n'est pas simplement gênant. Dans des tâches telles que l'analyse de marché, l'examen de copytrading et la préparation de transactions, un contexte oublié et une mémoire obsolète peuvent entraîner des latences, des erreurs répétées, une faible auditabilité et des décisions risquées. Nous proposons le harnais de connaissance natif de l'interaction (InKH), une architecture pour les agents LLM financiers qui absorbe la complexité dans le système. InKH convertit les événements utilisateur, de marché, de portefeuille et d'outil en connaissances opérationnelles structurées. Il utilise une injection passive de connaissances pour assembler un tampon de contexte de travail borné avant l'étape principale du modèle, une mémoire à graphe temporel pour une récupération à faible latence, une surface d'audit wiki pour une gouvernance lisible par l'humain, ainsi qu'une extraction en arrière-plan avec maturité, décroissance et invalidation au moment de l'écriture. Nous évaluons InKH sur un benchmark synthétique contrôlé reproductible avec 24 germes aléatoires, 4 tours, 80 épisodes par tour et 6 lignes de base, produisant 46 080 évaluations conditionnées par les lignes de base. InKH atteint une qualité moyenne des tâches de 0,815 pour une latence de 900 ms. Comparé à une mémoire de type wiki-walk pilotée par l'agent, il réduit la latence de 82,95 %, le coût en tokens de 82,29 % et l'utilisation de connaissances obsolètes de 96,58 %, tout en améliorant la qualité de 0,108 et la traçabilité de 0,461. Comparé à un système à graphe temporel sans invalidation, il améliore la qualité de 0,050 et réduit l'utilisation de mémoire obsolète de 96,58 % pour un coût de service comparable. Les résultats soutiennent une thèse de conception pour l'IA financière : l'adoption se produit lorsque la complexité est absorbée par le système plutôt que transférée à l'utilisateur. Le benchmark valide le comportement au niveau de l'architecture, et non les performances en trading réel.

English

Financial AI agents often fail for a simple reason: they make users carry the complexity. A user must repeatedly restate goals, risk preferences, portfolio context, past judgments, and shifting market assumptions, while the agent answers, retrieves, acts, and forgets. In finance, this is not just inconvenient. In tasks such as market analysis, copy-trading review, and trade preparation, forgotten context and stale memory can create latency, repeated errors, weak auditability, and unsafe decisions. We propose the interaction-native knowledge harness (InKH), an architecture for financial LLM agents that absorbs complexity into the system. InKH converts user, market, portfolio, and tool events into structured operational knowledge. It uses passive knowledge injection to assemble a bounded working context buffer before the main model step, temporal graph memory for low-latency retrieval, a wiki audit surface for human-readable governance, and background extraction with maturity, decay, and write-time invalidation. We evaluate InKH on a reproducible controlled synthetic benchmark with 24 random seeds, 4 rounds, 80 episodes per round, and 6 baselines, producing 46,080 baseline-conditioned evaluations. InKH achieves mean task quality of 0.815 at 900 ms latency. Compared with agent-driven wiki-walk memory, it reduces latency by 82.95 percent, token cost by 82.29 percent, and stale-knowledge usage by 96.58 percent, while improving quality by 0.108 and traceability by 0.461. Compared with a temporal-graph system without invalidation, it improves quality by 0.050 and reduces stale-memory usage by 96.58 percent with comparable serving cost. The results support a design thesis for financial AI: adoption happens when complexity is absorbed by the system rather than transferred to the user. The benchmark validates architecture-level behavior, not live trading performance.