AlphaQuanter: Een End-to-End Gereedschapsgestuurd Agentisch Versterkend Leerframework voor Aandelentransacties
AlphaQuanter: An End-to-End Tool-Orchestrated Agentic Reinforcement Learning Framework for Stock Trading
October 16, 2025
Auteurs: Zheye Deng, Jiashu Wang
cs.AI
Samenvatting
Hoewel Large Language Model (LLM)-agenten veelbelovend zijn in geautomatiseerd handelen, kampen ze nog steeds met kritieke beperkingen. Prominente multi-agent frameworks lijden vaak aan inefficiëntie, produceren inconsistente signalen en missen de end-to-end optimalisatie die nodig is om een coherente strategie te leren uit marktfeedback. Om dit aan te pakken, introduceren we AlphaQuanter, een single-agent framework dat reinforcement learning (RL) gebruikt om een dynamisch beleid te leren over een transparante, tool-augmented beslissingsworkflow. Dit stelt een enkele agent in staat om tools autonoom te orkestreren en proactief informatie op te vragen wanneer nodig, wat resulteert in een transparant en controleerbaar redeneerproces. Uitgebreide experimenten tonen aan dat AlphaQuanter state-of-the-art prestaties behaalt op belangrijke financiële metrieken. Bovendien onthult zijn interpreteerbare redenering geavanceerde strategieën, wat nieuwe en waardevolle inzichten biedt voor menselijke handelaren. Onze code voor data-acquisitie en agenttraining is publiekelijk beschikbaar op: https://github.com/AlphaQuanter/AlphaQuanter
English
While Large Language Model (LLM) agents show promise in automated trading,
they still face critical limitations. Prominent multi-agent frameworks often
suffer from inefficiency, produce inconsistent signals, and lack the end-to-end
optimization required to learn a coherent strategy from market feedback. To
address this, we introduce AlphaQuanter, a single-agent framework that uses
reinforcement learning (RL) to learn a dynamic policy over a transparent,
tool-augmented decision workflow, which empowers a single agent to autonomously
orchestrate tools and proactively acquire information on demand, establishing a
transparent and auditable reasoning process. Extensive experiments demonstrate
that AlphaQuanter achieves state-of-the-art performance on key financial
metrics. Moreover, its interpretable reasoning reveals sophisticated
strategies, offering novel and valuable insights for human traders. Our code
for data acquisition and agent training is publicly available at:
https://github.com/AlphaQuanter/AlphaQuanter