ChatPaper.aiChatPaper

AlphaQuanter: 주식 거래를 위한 도구-조율형 에이전트 강화 학습 종단간 프레임워크

AlphaQuanter: An End-to-End Tool-Orchestrated Agentic Reinforcement Learning Framework for Stock Trading

October 16, 2025
저자: Zheye Deng, Jiashu Wang
cs.AI

초록

대형 언어 모델(LLM) 에이전트가 자동화된 트레이딩에서 유망한 가능성을 보여주고 있지만, 여전히 중요한 한계에 직면해 있습니다. 주요 다중 에이전트 프레임워크는 종종 비효율성으로 인해 고통받고, 일관되지 않은 신호를 생성하며, 시장 피드백으로부터 일관된 전략을 학습하기 위한 종단 간 최적화가 부족합니다. 이를 해결하기 위해, 우리는 AlphaQuanter를 소개합니다. AlphaQuanter는 강화 학습(RL)을 사용하여 투명하고 도구가 강화된 의사결정 워크플로우에 대한 동적 정책을 학습하는 단일 에이전트 프레임워크로, 단일 에이전트가 도구를 자율적으로 조율하고 필요에 따라 정보를 능동적으로 획득할 수 있도록 하여 투명하고 감사 가능한 추론 프로세스를 구축합니다. 광범위한 실험을 통해 AlphaQuanter가 주요 금융 지표에서 최첨단 성능을 달성함을 입증했습니다. 또한, 해석 가능한 추론은 정교한 전략을 드러내어 인간 트레이더에게 새롭고 가치 있는 통찰을 제공합니다. 데이터 수집 및 에이전트 학습을 위한 우리의 코드는 https://github.com/AlphaQuanter/AlphaQuanter에서 공개적으로 이용 가능합니다.
English
While Large Language Model (LLM) agents show promise in automated trading, they still face critical limitations. Prominent multi-agent frameworks often suffer from inefficiency, produce inconsistent signals, and lack the end-to-end optimization required to learn a coherent strategy from market feedback. To address this, we introduce AlphaQuanter, a single-agent framework that uses reinforcement learning (RL) to learn a dynamic policy over a transparent, tool-augmented decision workflow, which empowers a single agent to autonomously orchestrate tools and proactively acquire information on demand, establishing a transparent and auditable reasoning process. Extensive experiments demonstrate that AlphaQuanter achieves state-of-the-art performance on key financial metrics. Moreover, its interpretable reasoning reveals sophisticated strategies, offering novel and valuable insights for human traders. Our code for data acquisition and agent training is publicly available at: https://github.com/AlphaQuanter/AlphaQuanter
PDF72October 22, 2025