Synthese von verhaltensbasierten Argumentationsketten: Ein Datengenerierungsrahmenwerk für LLMs im Bereich der persönlichen Finanzen

papers.abstract

Personalisierte Finanzberatung erfordert die Berücksichtigung von Nutzerzielen, Einschränkungen, Risikotoleranz und Rechtszuständigkeiten. Bisherige Arbeiten mit großen Sprachmodellen (LLMs) konzentrierten sich auf Unterstützungssysteme für Anleger und Finanzplaner. Gleichzeitig untersuchen zahlreiche aktuelle Studien breitere Aufgaben der persönlichen Finanzplanung, einschließlich Budgetierung, Schuldenmanagement, Altersvorsorge und Nachlassplanung, durch agentenbasierte Pipelines, die hohe Wartungskosten verursachen und weniger als 25 % der erwarteten finanziellen Renditen erzielen. In dieser Studie stellen wir einen neuartigen und reproduzierbaren Rahmen vor, der relevante finanzielle Kontexte mit Studien zur Verhaltensfinanzierung integriert, um Aufsichtsdaten für End-to-End-Berater zu erstellen. Mit diesem Rahmen erstellen wir ein 19k-Beispiele umfassendes Reasoning-Datenset und führen ein umfassendes Fine-Tuning des Qwen-3-8B-Modells auf diesem Datensatz durch. Durch einen zurückgehaltenen Test-Split und eine blinde LLM-Jury-Studie zeigen wir, dass durch sorgfältige Datenkuratierung und Verhaltensintegration unser 8B-Modell eine Leistung erzielt, die mit deutlich größeren Baselines (14-32B Parameter) in Bezug auf faktische Genauigkeit, Flüssigkeit und Personalisierung vergleichbar ist, während es 80 % geringere Kosten als die größeren Gegenstücke verursacht.

English

Personalized financial advice requires consideration of user goals, constraints, risk tolerance, and jurisdiction. Prior LLM work has focused on support systems for investors and financial planners. Simultaneously, numerous recent studies examine broader personal finance tasks, including budgeting, debt management, retirement, and estate planning, through agentic pipelines that incur high maintenance costs, yielding less than 25% of their expected financial returns. In this study, we introduce a novel and reproducible framework that integrates relevant financial context with behavioral finance studies to construct supervision data for end-to-end advisors. Using this framework, we create a 19k sample reasoning dataset and conduct a comprehensive fine-tuning of the Qwen-3-8B model on the dataset. Through a held-out test split and a blind LLM-jury study, we demonstrate that through careful data curation and behavioral integration, our 8B model achieves performance comparable to significantly larger baselines (14-32B parameters) across factual accuracy, fluency, and personalization metrics while incurring 80% lower costs than the larger counterparts.

Synthese von verhaltensbasierten Argumentationsketten: Ein Datengenerierungsrahmenwerk für LLMs im Bereich der persönlichen Finanzen

Synthesizing Behaviorally-Grounded Reasoning Chains: A Data-Generation Framework for Personal Finance LLMs

papers.abstract

Support