ChatPaper.aiChatPaper

AlphaQuanter: Сквозная фреймворк агентного обучения с подкреплением с использованием инструментов для торговли на фондовом рынке

AlphaQuanter: An End-to-End Tool-Orchestrated Agentic Reinforcement Learning Framework for Stock Trading

October 16, 2025
Авторы: Zheye Deng, Jiashu Wang
cs.AI

Аннотация

Хотя агенты на основе больших языковых моделей (LLM) демонстрируют перспективы в автоматизированной торговле, они всё ещё сталкиваются с серьёзными ограничениями. Известные мультиагентные фреймворки часто страдают от неэффективности, генерируют противоречивые сигналы и не обладают сквозной оптимизацией, необходимой для обучения согласованной стратегии на основе рыночной обратной связи. Для решения этих проблем мы представляем AlphaQuanter — одноагентный фреймворк, использующий обучение с подкреплением (RL) для изучения динамической политики в рамках прозрачного, инструментально-расширенного процесса принятия решений. Это позволяет одному агенту автономно управлять инструментами и активно получать информацию по запросу, создавая прозрачный и поддающийся аудиту процесс рассуждений. Многочисленные эксперименты показывают, что AlphaQuanter достигает передовых показателей по ключевым финансовым метрикам. Более того, его интерпретируемые рассуждения раскрывают сложные стратегии, предлагая новые и ценные инсайты для трейдеров. Наш код для сбора данных и обучения агента доступен по адресу: https://github.com/AlphaQuanter/AlphaQuanter.
English
While Large Language Model (LLM) agents show promise in automated trading, they still face critical limitations. Prominent multi-agent frameworks often suffer from inefficiency, produce inconsistent signals, and lack the end-to-end optimization required to learn a coherent strategy from market feedback. To address this, we introduce AlphaQuanter, a single-agent framework that uses reinforcement learning (RL) to learn a dynamic policy over a transparent, tool-augmented decision workflow, which empowers a single agent to autonomously orchestrate tools and proactively acquire information on demand, establishing a transparent and auditable reasoning process. Extensive experiments demonstrate that AlphaQuanter achieves state-of-the-art performance on key financial metrics. Moreover, its interpretable reasoning reveals sophisticated strategies, offering novel and valuable insights for human traders. Our code for data acquisition and agent training is publicly available at: https://github.com/AlphaQuanter/AlphaQuanter
PDF72October 22, 2025