Synthétiser des chaînes de raisonnement ancrées dans le comportement : Un cadre de génération de données pour les LLM en finance personnelle

papers.abstract

Les conseils financiers personnalisés nécessitent la prise en compte des objectifs, des contraintes, de la tolérance au risque et de la juridiction de l'utilisateur. Les travaux antérieurs sur les LLM se sont concentrés sur les systèmes d'aide pour les investisseurs et les planificateurs financiers. Parallèlement, de nombreuses études récentes examinent des tâches plus larges en matière de finances personnelles, y compris la budgétisation, la gestion de la dette, la retraite et la planification successorale, à travers des pipelines agentiques qui engendrent des coûts de maintenance élevés, générant moins de 25 % de leurs rendements financiers attendus. Dans cette étude, nous introduisons un cadre novateur et reproductible qui intègre un contexte financier pertinent avec des études de finance comportementale pour construire des données de supervision pour des conseillers de bout en bout. En utilisant ce cadre, nous créons un ensemble de données de raisonnement de 19 000 échantillons et effectuons un ajustement fin complet du modèle Qwen-3-8B sur cet ensemble. Grâce à une division de test réservée et à une étude à l'aveugle par un jury de LLM, nous démontrons qu'avec une curation minutieuse des données et une intégration comportementale, notre modèle de 8B atteint des performances comparables à des modèles de référence nettement plus grands (14-32 milliards de paramètres) en termes de précision factuelle, de fluidité et de personnalisation, tout en engendrant des coûts 80 % inférieurs à ceux des modèles plus volumineux.

English

Personalized financial advice requires consideration of user goals, constraints, risk tolerance, and jurisdiction. Prior LLM work has focused on support systems for investors and financial planners. Simultaneously, numerous recent studies examine broader personal finance tasks, including budgeting, debt management, retirement, and estate planning, through agentic pipelines that incur high maintenance costs, yielding less than 25% of their expected financial returns. In this study, we introduce a novel and reproducible framework that integrates relevant financial context with behavioral finance studies to construct supervision data for end-to-end advisors. Using this framework, we create a 19k sample reasoning dataset and conduct a comprehensive fine-tuning of the Qwen-3-8B model on the dataset. Through a held-out test split and a blind LLM-jury study, we demonstrate that through careful data curation and behavioral integration, our 8B model achieves performance comparable to significantly larger baselines (14-32B parameters) across factual accuracy, fluency, and personalization metrics while incurring 80% lower costs than the larger counterparts.

Synthétiser des chaînes de raisonnement ancrées dans le comportement : Un cadre de génération de données pour les LLM en finance personnelle

Synthesizing Behaviorally-Grounded Reasoning Chains: A Data-Generation Framework for Personal Finance LLMs

papers.abstract

Support