Agentar-Fin-R1: Повышение финансового интеллекта через экспертные знания в предметной области, эффективность обучения и продвинутые методы рассуждений

Аннотация

Крупные языковые модели (LLMs) демонстрируют значительный потенциал в финансовых приложениях; однако существующие модели часто проявляют ограничения в сценариях, требующих развитых способностей к рассуждению, строгих критериев надежности и эффективной адаптации к специфическим требованиям предметной области. Мы представляем серию финансовых крупных языковых моделей Agentar-Fin-R1 (8B и 32B параметров), специально разработанных на основе базовой модели Qwen3 для улучшения способностей к рассуждению, надежности и специализации в финансовых приложениях. Наш подход к оптимизации интегрирует высококачественную систематизированную систему меток для финансовых задач с комплексной многоуровневой структурой обеспечения надежности. Эта структура включает инженерию надежных знаний высокого качества, синтез надежных данных с использованием многоагентных систем и строгий контроль валидации данных. Благодаря автоматизированной оптимизации с учетом сложности на основе меток, двухэтапному процессу обучения и динамическим системам атрибуции мы достигаем значительного повышения эффективности обучения. Наши модели проходят всестороннюю оценку на основных финансовых бенчмарках, включая Fineva, FinEval и FinanceIQ, а также на наборах данных для общего рассуждения, таких как MATH-500 и GPQA-diamond. Для тщательной оценки возможностей реального развертывания мы инновационно предлагаем бенчмарк Finova, который фокусируется на финансовом рассуждении на уровне агентов и проверке соответствия. Экспериментальные результаты показывают, что Agentar-Fin-R1 не только достигает передовых показателей в финансовых задачах, но и демонстрирует исключительные способности к общему рассуждению, подтверждая свою эффективность как надежное решение для высокорисковых финансовых приложений. Бенчмарк Finova доступен по адресу https://github.com/antgroup/Finova.

English

Large Language Models (LLMs) exhibit considerable promise in financial applications; however, prevailing models frequently demonstrate limitations when confronted with scenarios that necessitate sophisticated reasoning capabilities, stringent trustworthiness criteria, and efficient adaptation to domain-specific requirements. We introduce the Agentar-Fin-R1 series of financial large language models (8B and 32B parameters), specifically engineered based on the Qwen3 foundation model to enhance reasoning capabilities, reliability, and domain specialization for financial applications. Our optimization approach integrates a high-quality, systematic financial task label system with a comprehensive multi-layered trustworthiness assurance framework. This framework encompasses high-quality trustworthy knowledge engineering, multi-agent trustworthy data synthesis, and rigorous data validation governance. Through label-guided automated difficulty-aware optimization, tow-stage training pipeline, and dynamic attribution systems, we achieve substantial improvements in training efficiency. Our models undergo comprehensive evaluation on mainstream financial benchmarks including Fineva, FinEval, and FinanceIQ, as well as general reasoning datasets such as MATH-500 and GPQA-diamond. To thoroughly assess real-world deployment capabilities, we innovatively propose the Finova evaluation benchmark, which focuses on agent-level financial reasoning and compliance verification. Experimental results demonstrate that Agentar-Fin-R1 not only achieves state-of-the-art performance on financial tasks but also exhibits exceptional general reasoning capabilities, validating its effectiveness as a trustworthy solution for high-stakes financial applications. The Finova bench is available at https://github.com/antgroup/Finova.

Agentar-Fin-R1: Повышение финансового интеллекта через экспертные знания в предметной области, эффективность обучения и продвинутые методы рассуждений

Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning

Аннотация

Support