Sintetizando Cadenas de Razonamiento Basadas en Comportamiento: Un Marco de Generación de Datos para LLMs de Finanzas Personales
Synthesizing Behaviorally-Grounded Reasoning Chains: A Data-Generation Framework for Personal Finance LLMs
September 17, 2025
Autores: Akhil Theerthala
cs.AI
Resumen
La asesoría financiera personalizada requiere considerar los objetivos del usuario, restricciones, tolerancia al riesgo y jurisdicción. Trabajos previos con LLM se han centrado en sistemas de apoyo para inversionistas y planificadores financieros. Simultáneamente, numerosos estudios recientes examinan tareas más amplias de finanzas personales, como presupuestos, manejo de deudas, jubilación y planificación patrimonial, a través de pipelines agenticos que incurren en altos costos de mantenimiento, generando menos del 25% de los rendimientos financieros esperados. En este estudio, presentamos un marco novedoso y reproducible que integra contexto financiero relevante con estudios de finanzas conductuales para construir datos de supervisión para asesores de extremo a extremo. Utilizando este marco, creamos un conjunto de datos de razonamiento de 19k muestras y realizamos un ajuste fino exhaustivo del modelo Qwen-3-8B en dicho conjunto. A través de una división de prueba reservada y un estudio ciego con un jurado de LLM, demostramos que, mediante una cuidadosa curación de datos e integración conductual, nuestro modelo de 8B logra un rendimiento comparable a líneas base significativamente más grandes (14-32B parámetros) en métricas de precisión factual, fluidez y personalización, mientras incurre en costos un 80% menores que sus contrapartes más grandes.
English
Personalized financial advice requires consideration of user goals,
constraints, risk tolerance, and jurisdiction. Prior LLM work has focused on
support systems for investors and financial planners. Simultaneously, numerous
recent studies examine broader personal finance tasks, including budgeting,
debt management, retirement, and estate planning, through agentic pipelines
that incur high maintenance costs, yielding less than 25% of their expected
financial returns. In this study, we introduce a novel and reproducible
framework that integrates relevant financial context with behavioral finance
studies to construct supervision data for end-to-end advisors. Using this
framework, we create a 19k sample reasoning dataset and conduct a comprehensive
fine-tuning of the Qwen-3-8B model on the dataset. Through a held-out test
split and a blind LLM-jury study, we demonstrate that through careful data
curation and behavioral integration, our 8B model achieves performance
comparable to significantly larger baselines (14-32B parameters) across factual
accuracy, fluency, and personalization metrics while incurring 80% lower costs
than the larger counterparts.