Agentar-Fin-R1: Повышение финансового интеллекта через экспертные знания в предметной области, эффективность обучения и продвинутые методы рассуждений
Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning
July 22, 2025
Авторы: Yanjun Zheng, Xiyang Du, Longfei Liao, Xiaoke Zhao, Zhaowen Zhou, Jingze Song, Bo Zhang, Jiawei Liu, Xiang Qi, Zhe Li, Zhiqiang Zhang, Wei Wang, Peng Zhang
cs.AI
Аннотация
Крупные языковые модели (LLMs) демонстрируют значительный потенциал в финансовых приложениях; однако существующие модели часто проявляют ограничения в сценариях, требующих развитых способностей к рассуждению, строгих критериев надежности и эффективной адаптации к специфическим требованиям предметной области. Мы представляем серию финансовых крупных языковых моделей Agentar-Fin-R1 (8B и 32B параметров), специально разработанных на основе базовой модели Qwen3 для улучшения способностей к рассуждению, надежности и специализации в финансовых приложениях. Наш подход к оптимизации интегрирует высококачественную систематизированную систему меток для финансовых задач с комплексной многоуровневой структурой обеспечения надежности. Эта структура включает инженерию надежных знаний высокого качества, синтез надежных данных с использованием многоагентных систем и строгий контроль валидации данных. Благодаря автоматизированной оптимизации с учетом сложности на основе меток, двухэтапному процессу обучения и динамическим системам атрибуции мы достигаем значительного повышения эффективности обучения. Наши модели проходят всестороннюю оценку на основных финансовых бенчмарках, включая Fineva, FinEval и FinanceIQ, а также на наборах данных для общего рассуждения, таких как MATH-500 и GPQA-diamond. Для тщательной оценки возможностей реального развертывания мы инновационно предлагаем бенчмарк Finova, который фокусируется на финансовом рассуждении на уровне агентов и проверке соответствия. Экспериментальные результаты показывают, что Agentar-Fin-R1 не только достигает передовых показателей в финансовых задачах, но и демонстрирует исключительные способности к общему рассуждению, подтверждая свою эффективность как надежное решение для высокорисковых финансовых приложений. Бенчмарк Finova доступен по адресу https://github.com/antgroup/Finova.
English
Large Language Models (LLMs) exhibit considerable promise in financial
applications; however, prevailing models frequently demonstrate limitations
when confronted with scenarios that necessitate sophisticated reasoning
capabilities, stringent trustworthiness criteria, and efficient adaptation to
domain-specific requirements. We introduce the Agentar-Fin-R1 series of
financial large language models (8B and 32B parameters), specifically
engineered based on the Qwen3 foundation model to enhance reasoning
capabilities, reliability, and domain specialization for financial
applications. Our optimization approach integrates a high-quality, systematic
financial task label system with a comprehensive multi-layered trustworthiness
assurance framework. This framework encompasses high-quality trustworthy
knowledge engineering, multi-agent trustworthy data synthesis, and rigorous
data validation governance. Through label-guided automated difficulty-aware
optimization, tow-stage training pipeline, and dynamic attribution systems, we
achieve substantial improvements in training efficiency. Our models undergo
comprehensive evaluation on mainstream financial benchmarks including Fineva,
FinEval, and FinanceIQ, as well as general reasoning datasets such as MATH-500
and GPQA-diamond. To thoroughly assess real-world deployment capabilities, we
innovatively propose the Finova evaluation benchmark, which focuses on
agent-level financial reasoning and compliance verification. Experimental
results demonstrate that Agentar-Fin-R1 not only achieves state-of-the-art
performance on financial tasks but also exhibits exceptional general reasoning
capabilities, validating its effectiveness as a trustworthy solution for
high-stakes financial applications. The Finova bench is available at
https://github.com/antgroup/Finova.