ChatPaper.aiChatPaper

Agentar-Fin-R1: Verbetering van Financiële Intelligentie door Domeinexpertise, Trainings efficiëntie en Geavanceerd Redeneren

Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning

July 22, 2025
Auteurs: Yanjun Zheng, Xiyang Du, Longfei Liao, Xiaoke Zhao, Zhaowen Zhou, Jingze Song, Bo Zhang, Jiawei Liu, Xiang Qi, Zhe Li, Zhiqiang Zhang, Wei Wang, Peng Zhang
cs.AI

Samenvatting

Grote Taalmodellen (LLMs) tonen aanzienlijke belofte in financiële toepassingen; echter, heersende modellen vertonen vaak beperkingen wanneer ze worden geconfronteerd met scenario's die geavanceerde redeneervaardigheden, strikte betrouwbaarheidscriteria en efficiënte aanpassing aan domeinspecifieke vereisten vereisen. Wij introduceren de Agentar-Fin-R1-serie van financiële grote taalmodellen (8B en 32B parameters), specifiek ontworpen op basis van het Qwen3-basismodel om redeneervaardigheden, betrouwbaarheid en domeinspecialisatie voor financiële toepassingen te verbeteren. Onze optimalisatieaanpak integreert een hoogwaardig, systematisch labelingsysteem voor financiële taken met een uitgebreid meerlaags betrouwbaarheidsborgingskader. Dit kader omvat hoogwaardige betrouwbare kennisengineering, multi-agent betrouwbare datasynthese en rigoureuze datavalidatiegovernance. Door label-gestuurde automatische moeilijkheidsbewuste optimalisatie, een tweefasig trainingspijplijn en dynamische attributiesystemen bereiken we aanzienlijke verbeteringen in de trainings efficiëntie. Onze modellen ondergaan uitgebreide evaluatie op mainstream financiële benchmarks, waaronder Fineva, FinEval en FinanceIQ, evenals algemene redeneerdatasets zoals MATH-500 en GPQA-diamond. Om de implementatiemogelijkheden in de praktijk grondig te beoordelen, stellen we innovatief de Finova-evaluatiebenchmark voor, die zich richt op agent-niveau financiële redenering en nalevingsverificatie. Experimentele resultaten tonen aan dat Agentar-Fin-R1 niet alleen state-of-the-art prestaties bereikt op financiële taken, maar ook uitzonderlijke algemene redeneervaardigheden vertoont, wat de effectiviteit ervan als een betrouwbare oplossing voor hoogwaardige financiële toepassingen valideert. De Finova-bench is beschikbaar op https://github.com/antgroup/Finova.
English
Large Language Models (LLMs) exhibit considerable promise in financial applications; however, prevailing models frequently demonstrate limitations when confronted with scenarios that necessitate sophisticated reasoning capabilities, stringent trustworthiness criteria, and efficient adaptation to domain-specific requirements. We introduce the Agentar-Fin-R1 series of financial large language models (8B and 32B parameters), specifically engineered based on the Qwen3 foundation model to enhance reasoning capabilities, reliability, and domain specialization for financial applications. Our optimization approach integrates a high-quality, systematic financial task label system with a comprehensive multi-layered trustworthiness assurance framework. This framework encompasses high-quality trustworthy knowledge engineering, multi-agent trustworthy data synthesis, and rigorous data validation governance. Through label-guided automated difficulty-aware optimization, tow-stage training pipeline, and dynamic attribution systems, we achieve substantial improvements in training efficiency. Our models undergo comprehensive evaluation on mainstream financial benchmarks including Fineva, FinEval, and FinanceIQ, as well as general reasoning datasets such as MATH-500 and GPQA-diamond. To thoroughly assess real-world deployment capabilities, we innovatively propose the Finova evaluation benchmark, which focuses on agent-level financial reasoning and compliance verification. Experimental results demonstrate that Agentar-Fin-R1 not only achieves state-of-the-art performance on financial tasks but also exhibits exceptional general reasoning capabilities, validating its effectiveness as a trustworthy solution for high-stakes financial applications. The Finova bench is available at https://github.com/antgroup/Finova.
PDF84July 25, 2025