ChatPaper.aiChatPaper

Sintetizzare Catene di Ragionamento Basate sul Comportamento: Un Framework per la Generazione di Dati per LLM nel Campo della Finanza Personale

Synthesizing Behaviorally-Grounded Reasoning Chains: A Data-Generation Framework for Personal Finance LLMs

September 17, 2025
Autori: Akhil Theerthala
cs.AI

Abstract

La consulenza finanziaria personalizzata richiede la considerazione degli obiettivi dell'utente, dei vincoli, della tolleranza al rischio e della giurisdizione. I precedenti lavori sui LLM si sono concentrati su sistemi di supporto per investitori e pianificatori finanziari. Allo stesso tempo, numerosi studi recenti esaminano compiti più ampi di finanza personale, tra cui budgeting, gestione del debito, pensionamento e pianificazione patrimoniale, attraverso pipeline agentiche che comportano costi di manutenzione elevati, producendo meno del 25% dei rendimenti finanziari attesi. In questo studio, introduciamo un framework innovativo e riproducibile che integra il contesto finanziario rilevante con studi di finanza comportamentale per costruire dati di supervisione per consulenti end-to-end. Utilizzando questo framework, creiamo un dataset di ragionamento di 19k campioni e conducono un fine-tuning completo del modello Qwen-3-8B sul dataset. Attraverso una divisione di test separata e uno studio cieco con giuria LLM, dimostriamo che, attraverso un'attenta cura dei dati e l'integrazione comportamentale, il nostro modello da 8B raggiunge prestazioni comparabili a baseline significativamente più grandi (14-32B parametri) in termini di accuratezza fattuale, fluidità e metriche di personalizzazione, con costi inferiori dell'80% rispetto alle controparti più grandi.
English
Personalized financial advice requires consideration of user goals, constraints, risk tolerance, and jurisdiction. Prior LLM work has focused on support systems for investors and financial planners. Simultaneously, numerous recent studies examine broader personal finance tasks, including budgeting, debt management, retirement, and estate planning, through agentic pipelines that incur high maintenance costs, yielding less than 25% of their expected financial returns. In this study, we introduce a novel and reproducible framework that integrates relevant financial context with behavioral finance studies to construct supervision data for end-to-end advisors. Using this framework, we create a 19k sample reasoning dataset and conduct a comprehensive fine-tuning of the Qwen-3-8B model on the dataset. Through a held-out test split and a blind LLM-jury study, we demonstrate that through careful data curation and behavioral integration, our 8B model achieves performance comparable to significantly larger baselines (14-32B parameters) across factual accuracy, fluency, and personalization metrics while incurring 80% lower costs than the larger counterparts.
PDF02September 18, 2025