Absorbiendo la complejidad: Un sistema de conocimiento nativo de la interacción para agentes LLM financieros
Absorbing Complexity: An Interaction-Native Knowledge Harness for Financial LLM Agents
June 1, 2026
Autores: Ailiya Borjigin, Igor Stadnyk, Ben Bilski, Maksym Chikita, Dmytro Kyrylenko, Sofiia Pidturkina, Julia Stadnyk
cs.AI
Resumen
Los agentes financieros basados en IA suelen fallar por una razón sencilla: le transfieren la complejidad al usuario. El usuario debe reiterar constantemente sus objetivos, preferencias de riesgo, contexto de cartera, juicios previos y supuestos de mercado cambiantes, mientras que el agente responde, recupera, actúa y olvida. En finanzas, esto no es solo una molestia. En tareas como el análisis de mercado, la revisión de copytrading y la preparación de operaciones, el contexto olvidado y la memoria obsoleta pueden generar latencia, errores recurrentes, una auditoría deficiente y decisiones inseguras.
Proponemos el arnés de conocimiento nativo a la interacción (InKH, por sus siglas en inglés), una arquitectura para agentes financieros basados en LLM que absorbe la complejidad en el sistema. InKH convierte los eventos del usuario, del mercado, de la cartera y de las herramientas en conocimiento operativo estructurado. Utiliza inyección pasiva de conocimiento para ensamblar un búfer de contexto de trabajo acotado antes del paso principal del modelo, memoria gráfica temporal para recuperación de baja latencia, una superficie de auditoría tipo wiki para una gobernanza legible por humanos, y extracción de antecedentes con madurez, decaimiento e invalidación en tiempo de escritura.
Evaluamos InKH en un punto de referencia sintético controlado y reproducible con 24 semillas aleatorias, 4 rondas, 80 episodios por ronda y 6 líneas base, produciendo 46 080 evaluaciones condicionadas a las líneas base. InKH alcanza una calidad media de tarea de 0,815 con una latencia de 900 ms. En comparación con la memoria de recorrido wiki impulsada por el agente, reduce la latencia en un 82,95 %, el costo de tokens en un 82,29 % y el uso de conocimiento obsoleto en un 96,58 %, al tiempo que mejora la calidad en 0,108 y la trazabilidad en 0,461. En comparación con un sistema de grafo temporal sin invalidación, mejora la calidad en 0,050 y reduce el uso de memoria obsoleta en un 96,58 % con un costo de servicio comparable.
Los resultados respaldan una tesis de diseño para la IA financiera: la adopción se produce cuando la complejidad es absorbida por el sistema, no transferida al usuario. El punto de referencia valida el comportamiento a nivel de arquitectura, no el rendimiento en operaciones en vivo.
English
Financial AI agents often fail for a simple reason: they make users carry the complexity. A user must repeatedly restate goals, risk preferences, portfolio context, past judgments, and shifting market assumptions, while the agent answers, retrieves, acts, and forgets. In finance, this is not just inconvenient. In tasks such as market analysis, copy-trading review, and trade preparation, forgotten context and stale memory can create latency, repeated errors, weak auditability, and unsafe decisions.
We propose the interaction-native knowledge harness (InKH), an architecture for financial LLM agents that absorbs complexity into the system. InKH converts user, market, portfolio, and tool events into structured operational knowledge. It uses passive knowledge injection to assemble a bounded working context buffer before the main model step, temporal graph memory for low-latency retrieval, a wiki audit surface for human-readable governance, and background extraction with maturity, decay, and write-time invalidation.
We evaluate InKH on a reproducible controlled synthetic benchmark with 24 random seeds, 4 rounds, 80 episodes per round, and 6 baselines, producing 46,080 baseline-conditioned evaluations. InKH achieves mean task quality of 0.815 at 900 ms latency. Compared with agent-driven wiki-walk memory, it reduces latency by 82.95 percent, token cost by 82.29 percent, and stale-knowledge usage by 96.58 percent, while improving quality by 0.108 and traceability by 0.461. Compared with a temporal-graph system without invalidation, it improves quality by 0.050 and reduces stale-memory usage by 96.58 percent with comparable serving cost.
The results support a design thesis for financial AI: adoption happens when complexity is absorbed by the system rather than transferred to the user. The benchmark validates architecture-level behavior, not live trading performance.