Синтез поведенчески обоснованных цепочек рассуждений: фреймворк для генерации данных для языковых моделей в области личных финансов

Аннотация

Персонализированные финансовые рекомендации требуют учета целей пользователя, ограничений, толерантности к риску и юрисдикции. Предыдущие работы с использованием больших языковых моделей (LLM) были сосредоточены на системах поддержки инвесторов и финансовых планировщиков. Одновременно многочисленные недавние исследования изучают более широкие задачи личных финансов, включая бюджетирование, управление долгами, пенсионное и наследственное планирование, с использованием агентных конвейеров, которые требуют высоких затрат на обслуживание, принося менее 25% ожидаемой финансовой отдачи. В данном исследовании мы представляем новый и воспроизводимый фреймворк, который интегрирует соответствующий финансовый контекст с исследованиями поведенческих финансов для создания данных надзора для end-to-end советников. Используя этот фреймворк, мы создаем набор данных для рассуждений объемом 19 тыс. примеров и проводим всестороннюю тонкую настройку модели Qwen-3-8B на этом наборе данных. С помощью тестового разделения и слепого исследования с участием LLM-жюри мы демонстрируем, что благодаря тщательной курации данных и интеграции поведенческих аспектов наша 8B модель достигает производительности, сопоставимой с значительно более крупными базовыми моделями (14-32B параметров), по показателям фактической точности, беглости и персонализации, при этом затраты на нее на 80% ниже, чем у более крупных аналогов.

English

Personalized financial advice requires consideration of user goals, constraints, risk tolerance, and jurisdiction. Prior LLM work has focused on support systems for investors and financial planners. Simultaneously, numerous recent studies examine broader personal finance tasks, including budgeting, debt management, retirement, and estate planning, through agentic pipelines that incur high maintenance costs, yielding less than 25% of their expected financial returns. In this study, we introduce a novel and reproducible framework that integrates relevant financial context with behavioral finance studies to construct supervision data for end-to-end advisors. Using this framework, we create a 19k sample reasoning dataset and conduct a comprehensive fine-tuning of the Qwen-3-8B model on the dataset. Through a held-out test split and a blind LLM-jury study, we demonstrate that through careful data curation and behavioral integration, our 8B model achieves performance comparable to significantly larger baselines (14-32B parameters) across factual accuracy, fluency, and personalization metrics while incurring 80% lower costs than the larger counterparts.

Синтез поведенчески обоснованных цепочек рассуждений: фреймворк для генерации данных для языковых моделей в области личных финансов

Synthesizing Behaviorally-Grounded Reasoning Chains: A Data-Generation Framework for Personal Finance LLMs

Аннотация

Support