Agentar-Fin-R1: Verbetering van Financiële Intelligentie door Domeinexpertise, Trainings efficiëntie en Geavanceerd Redeneren
Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning
July 22, 2025
Auteurs: Yanjun Zheng, Xiyang Du, Longfei Liao, Xiaoke Zhao, Zhaowen Zhou, Jingze Song, Bo Zhang, Jiawei Liu, Xiang Qi, Zhe Li, Zhiqiang Zhang, Wei Wang, Peng Zhang
cs.AI
Samenvatting
Grote Taalmodellen (LLMs) tonen aanzienlijke belofte in financiële toepassingen; echter, heersende modellen vertonen vaak beperkingen wanneer ze worden geconfronteerd met scenario's die geavanceerde redeneervaardigheden, strikte betrouwbaarheidscriteria en efficiënte aanpassing aan domeinspecifieke vereisten vereisen. Wij introduceren de Agentar-Fin-R1-serie van financiële grote taalmodellen (8B en 32B parameters), specifiek ontworpen op basis van het Qwen3-basismodel om redeneervaardigheden, betrouwbaarheid en domeinspecialisatie voor financiële toepassingen te verbeteren. Onze optimalisatieaanpak integreert een hoogwaardig, systematisch labelingsysteem voor financiële taken met een uitgebreid meerlaags betrouwbaarheidsborgingskader. Dit kader omvat hoogwaardige betrouwbare kennisengineering, multi-agent betrouwbare datasynthese en rigoureuze datavalidatiegovernance. Door label-gestuurde automatische moeilijkheidsbewuste optimalisatie, een tweefasig trainingspijplijn en dynamische attributiesystemen bereiken we aanzienlijke verbeteringen in de trainings efficiëntie. Onze modellen ondergaan uitgebreide evaluatie op mainstream financiële benchmarks, waaronder Fineva, FinEval en FinanceIQ, evenals algemene redeneerdatasets zoals MATH-500 en GPQA-diamond. Om de implementatiemogelijkheden in de praktijk grondig te beoordelen, stellen we innovatief de Finova-evaluatiebenchmark voor, die zich richt op agent-niveau financiële redenering en nalevingsverificatie. Experimentele resultaten tonen aan dat Agentar-Fin-R1 niet alleen state-of-the-art prestaties bereikt op financiële taken, maar ook uitzonderlijke algemene redeneervaardigheden vertoont, wat de effectiviteit ervan als een betrouwbare oplossing voor hoogwaardige financiële toepassingen valideert. De Finova-bench is beschikbaar op https://github.com/antgroup/Finova.
English
Large Language Models (LLMs) exhibit considerable promise in financial
applications; however, prevailing models frequently demonstrate limitations
when confronted with scenarios that necessitate sophisticated reasoning
capabilities, stringent trustworthiness criteria, and efficient adaptation to
domain-specific requirements. We introduce the Agentar-Fin-R1 series of
financial large language models (8B and 32B parameters), specifically
engineered based on the Qwen3 foundation model to enhance reasoning
capabilities, reliability, and domain specialization for financial
applications. Our optimization approach integrates a high-quality, systematic
financial task label system with a comprehensive multi-layered trustworthiness
assurance framework. This framework encompasses high-quality trustworthy
knowledge engineering, multi-agent trustworthy data synthesis, and rigorous
data validation governance. Through label-guided automated difficulty-aware
optimization, tow-stage training pipeline, and dynamic attribution systems, we
achieve substantial improvements in training efficiency. Our models undergo
comprehensive evaluation on mainstream financial benchmarks including Fineva,
FinEval, and FinanceIQ, as well as general reasoning datasets such as MATH-500
and GPQA-diamond. To thoroughly assess real-world deployment capabilities, we
innovatively propose the Finova evaluation benchmark, which focuses on
agent-level financial reasoning and compliance verification. Experimental
results demonstrate that Agentar-Fin-R1 not only achieves state-of-the-art
performance on financial tasks but also exhibits exceptional general reasoning
capabilities, validating its effectiveness as a trustworthy solution for
high-stakes financial applications. The Finova bench is available at
https://github.com/antgroup/Finova.