AlphaQuanter: 株式取引のためのエンドツーエンドツールオーケストレーション型エージェント強化学習フレームワーク
AlphaQuanter: An End-to-End Tool-Orchestrated Agentic Reinforcement Learning Framework for Stock Trading
October 16, 2025
著者: Zheye Deng, Jiashu Wang
cs.AI
要旨
大規模言語モデル(LLM)エージェントは自動取引において有望であるものの、依然として重大な制約に直面している。代表的なマルチエージェントフレームワークは、非効率性に悩まされ、一貫性のないシグナルを生成し、市場のフィードバックから一貫した戦略を学ぶために必要なエンドツーエンドの最適化を欠いている。この問題に対処するため、我々はAlphaQuanterを提案する。これは、強化学習(RL)を用いて透明性の高いツール拡張意思決定ワークフロー上で動的なポリシーを学習するシングルエージェントフレームワークであり、単一のエージェントがツールを自律的に調整し、必要に応じて積極的に情報を取得することを可能にし、透明性と監査可能性のある推論プロセスを確立する。大規模な実験により、AlphaQuanterが主要な金融指標において最先端の性能を達成することが示された。さらに、その解釈可能な推論は洗練された戦略を明らかにし、人間のトレーダーにとって新規かつ価値ある洞察を提供する。データ取得およびエージェントトレーニングのコードは、https://github.com/AlphaQuanter/AlphaQuanter で公開されている。
English
While Large Language Model (LLM) agents show promise in automated trading,
they still face critical limitations. Prominent multi-agent frameworks often
suffer from inefficiency, produce inconsistent signals, and lack the end-to-end
optimization required to learn a coherent strategy from market feedback. To
address this, we introduce AlphaQuanter, a single-agent framework that uses
reinforcement learning (RL) to learn a dynamic policy over a transparent,
tool-augmented decision workflow, which empowers a single agent to autonomously
orchestrate tools and proactively acquire information on demand, establishing a
transparent and auditable reasoning process. Extensive experiments demonstrate
that AlphaQuanter achieves state-of-the-art performance on key financial
metrics. Moreover, its interpretable reasoning reveals sophisticated
strategies, offering novel and valuable insights for human traders. Our code
for data acquisition and agent training is publicly available at:
https://github.com/AlphaQuanter/AlphaQuanter