Sintetizando Cadenas de Razonamiento Basadas en Comportamiento: Un Marco de Generación de Datos para LLMs de Finanzas Personales

Resumen

La asesoría financiera personalizada requiere considerar los objetivos del usuario, restricciones, tolerancia al riesgo y jurisdicción. Trabajos previos con LLM se han centrado en sistemas de apoyo para inversionistas y planificadores financieros. Simultáneamente, numerosos estudios recientes examinan tareas más amplias de finanzas personales, como presupuestos, manejo de deudas, jubilación y planificación patrimonial, a través de pipelines agenticos que incurren en altos costos de mantenimiento, generando menos del 25% de los rendimientos financieros esperados. En este estudio, presentamos un marco novedoso y reproducible que integra contexto financiero relevante con estudios de finanzas conductuales para construir datos de supervisión para asesores de extremo a extremo. Utilizando este marco, creamos un conjunto de datos de razonamiento de 19k muestras y realizamos un ajuste fino exhaustivo del modelo Qwen-3-8B en dicho conjunto. A través de una división de prueba reservada y un estudio ciego con un jurado de LLM, demostramos que, mediante una cuidadosa curación de datos e integración conductual, nuestro modelo de 8B logra un rendimiento comparable a líneas base significativamente más grandes (14-32B parámetros) en métricas de precisión factual, fluidez y personalización, mientras incurre en costos un 80% menores que sus contrapartes más grandes.

English

Personalized financial advice requires consideration of user goals, constraints, risk tolerance, and jurisdiction. Prior LLM work has focused on support systems for investors and financial planners. Simultaneously, numerous recent studies examine broader personal finance tasks, including budgeting, debt management, retirement, and estate planning, through agentic pipelines that incur high maintenance costs, yielding less than 25% of their expected financial returns. In this study, we introduce a novel and reproducible framework that integrates relevant financial context with behavioral finance studies to construct supervision data for end-to-end advisors. Using this framework, we create a 19k sample reasoning dataset and conduct a comprehensive fine-tuning of the Qwen-3-8B model on the dataset. Through a held-out test split and a blind LLM-jury study, we demonstrate that through careful data curation and behavioral integration, our 8B model achieves performance comparable to significantly larger baselines (14-32B parameters) across factual accuracy, fluency, and personalization metrics while incurring 80% lower costs than the larger counterparts.

Sintetizando Cadenas de Razonamiento Basadas en Comportamiento: Un Marco de Generación de Datos para LLMs de Finanzas Personales

Synthesizing Behaviorally-Grounded Reasoning Chains: A Data-Generation Framework for Personal Finance LLMs

Resumen

Support