Synthétiser des chaînes de raisonnement ancrées dans le comportement : Un cadre de génération de données pour les LLM en finance personnelle
Synthesizing Behaviorally-Grounded Reasoning Chains: A Data-Generation Framework for Personal Finance LLMs
September 17, 2025
papers.authors: Akhil Theerthala
cs.AI
papers.abstract
Les conseils financiers personnalisés nécessitent la prise en compte des objectifs, des contraintes, de la tolérance au risque et de la juridiction de l'utilisateur. Les travaux antérieurs sur les LLM se sont concentrés sur les systèmes d'aide pour les investisseurs et les planificateurs financiers. Parallèlement, de nombreuses études récentes examinent des tâches plus larges en matière de finances personnelles, y compris la budgétisation, la gestion de la dette, la retraite et la planification successorale, à travers des pipelines agentiques qui engendrent des coûts de maintenance élevés, générant moins de 25 % de leurs rendements financiers attendus. Dans cette étude, nous introduisons un cadre novateur et reproductible qui intègre un contexte financier pertinent avec des études de finance comportementale pour construire des données de supervision pour des conseillers de bout en bout. En utilisant ce cadre, nous créons un ensemble de données de raisonnement de 19 000 échantillons et effectuons un ajustement fin complet du modèle Qwen-3-8B sur cet ensemble. Grâce à une division de test réservée et à une étude à l'aveugle par un jury de LLM, nous démontrons qu'avec une curation minutieuse des données et une intégration comportementale, notre modèle de 8B atteint des performances comparables à des modèles de référence nettement plus grands (14-32 milliards de paramètres) en termes de précision factuelle, de fluidité et de personnalisation, tout en engendrant des coûts 80 % inférieurs à ceux des modèles plus volumineux.
English
Personalized financial advice requires consideration of user goals,
constraints, risk tolerance, and jurisdiction. Prior LLM work has focused on
support systems for investors and financial planners. Simultaneously, numerous
recent studies examine broader personal finance tasks, including budgeting,
debt management, retirement, and estate planning, through agentic pipelines
that incur high maintenance costs, yielding less than 25% of their expected
financial returns. In this study, we introduce a novel and reproducible
framework that integrates relevant financial context with behavioral finance
studies to construct supervision data for end-to-end advisors. Using this
framework, we create a 19k sample reasoning dataset and conduct a comprehensive
fine-tuning of the Qwen-3-8B model on the dataset. Through a held-out test
split and a blind LLM-jury study, we demonstrate that through careful data
curation and behavioral integration, our 8B model achieves performance
comparable to significantly larger baselines (14-32B parameters) across factual
accuracy, fluency, and personalization metrics while incurring 80% lower costs
than the larger counterparts.