AlphaQuanter: Ein End-to-End-Tool-orchestriertes agentenbasiertes Reinforcement-Learning-Framework für den Aktienhandel

papers.abstract

Während Large Language Model (LLM)-Agenten vielversprechend im automatisierten Handel sind, stoßen sie dennoch auf kritische Einschränkungen. Prominente Multi-Agenten-Frameworks leiden häufig unter Ineffizienz, erzeugen inkonsistente Signale und mangeln der end-to-end-Optimierung, die erforderlich ist, um eine kohärente Strategie aus Marktfeedback zu erlernen. Um dies zu adressieren, stellen wir AlphaQuanter vor, ein Single-Agenten-Framework, das Reinforcement Learning (RL) nutzt, um eine dynamische Policy über einen transparenten, tool-augmentierten Entscheidungsprozess zu erlernen. Dies befähigt einen einzelnen Agenten, Werkzeuge autonom zu orchestrieren und proaktiv Informationen bei Bedarf zu beschaffen, wodurch ein transparenter und nachvollziehbarer Denkprozess etabliert wird. Umfangreiche Experimente zeigen, dass AlphaQuanter state-of-the-art Leistung bei wichtigen finanziellen Kennzahlen erreicht. Darüber hinaus offenbart sein interpretierbarer Denkprozess ausgefeilte Strategien, die neue und wertvolle Einblicke für menschliche Händler bieten. Unser Code für Datenerfassung und Agententraining ist öffentlich verfügbar unter: https://github.com/AlphaQuanter/AlphaQuanter.

English

While Large Language Model (LLM) agents show promise in automated trading, they still face critical limitations. Prominent multi-agent frameworks often suffer from inefficiency, produce inconsistent signals, and lack the end-to-end optimization required to learn a coherent strategy from market feedback. To address this, we introduce AlphaQuanter, a single-agent framework that uses reinforcement learning (RL) to learn a dynamic policy over a transparent, tool-augmented decision workflow, which empowers a single agent to autonomously orchestrate tools and proactively acquire information on demand, establishing a transparent and auditable reasoning process. Extensive experiments demonstrate that AlphaQuanter achieves state-of-the-art performance on key financial metrics. Moreover, its interpretable reasoning reveals sophisticated strategies, offering novel and valuable insights for human traders. Our code for data acquisition and agent training is publicly available at: https://github.com/AlphaQuanter/AlphaQuanter

AlphaQuanter: Ein End-to-End-Tool-orchestriertes agentenbasiertes Reinforcement-Learning-Framework für den Aktienhandel

AlphaQuanter: An End-to-End Tool-Orchestrated Agentic Reinforcement Learning Framework for Stock Trading

papers.abstract

Support