Sintetizando Cadeias de Raciocínio Fundamentadas no Comportamento: Um Framework de Geração de Dados para LLMs de Finanças Pessoais

Resumo

O aconselhamento financeiro personalizado requer a consideração dos objetivos do usuário, restrições, tolerância ao risco e jurisdição. Trabalhos anteriores com LLMs concentraram-se em sistemas de suporte para investidores e planejadores financeiros. Simultaneamente, numerosos estudos recentes examinam tarefas mais amplas de finanças pessoais, incluindo orçamento, gerenciamento de dívidas, aposentadoria e planejamento patrimonial, por meio de pipelines agentes que incorrem em altos custos de manutenção, gerando menos de 25% dos retornos financeiros esperados. Neste estudo, introduzimos uma estrutura nova e reproduzível que integra contexto financeiro relevante com estudos de finanças comportamentais para construir dados de supervisão para assessores de ponta a ponta. Utilizando essa estrutura, criamos um conjunto de dados de raciocínio com 19 mil amostras e realizamos um ajuste fino abrangente do modelo Qwen-3-8B nesse conjunto de dados. Por meio de uma divisão de teste reservada e um estudo cego com júri de LLMs, demonstramos que, através de uma curadoria cuidadosa de dados e integração comportamental, nosso modelo de 8B alcança desempenho comparável a baselines significativamente maiores (14-32B parâmetros) em métricas de precisão factual, fluência e personalização, enquanto incorre em custos 80% menores do que os modelos maiores.

English

Personalized financial advice requires consideration of user goals, constraints, risk tolerance, and jurisdiction. Prior LLM work has focused on support systems for investors and financial planners. Simultaneously, numerous recent studies examine broader personal finance tasks, including budgeting, debt management, retirement, and estate planning, through agentic pipelines that incur high maintenance costs, yielding less than 25% of their expected financial returns. In this study, we introduce a novel and reproducible framework that integrates relevant financial context with behavioral finance studies to construct supervision data for end-to-end advisors. Using this framework, we create a 19k sample reasoning dataset and conduct a comprehensive fine-tuning of the Qwen-3-8B model on the dataset. Through a held-out test split and a blind LLM-jury study, we demonstrate that through careful data curation and behavioral integration, our 8B model achieves performance comparable to significantly larger baselines (14-32B parameters) across factual accuracy, fluency, and personalization metrics while incurring 80% lower costs than the larger counterparts.

Sintetizando Cadeias de Raciocínio Fundamentadas no Comportamento: Um Framework de Geração de Dados para LLMs de Finanças Pessoais

Synthesizing Behaviorally-Grounded Reasoning Chains: A Data-Generation Framework for Personal Finance LLMs

Resumo

Support