ChatPaper.aiChatPaper

AlphaQuanter : Un cadre d'apprentissage par renforcement agentique orchestré par des outils de bout en bout pour le trading d'actions

AlphaQuanter: An End-to-End Tool-Orchestrated Agentic Reinforcement Learning Framework for Stock Trading

October 16, 2025
papers.authors: Zheye Deng, Jiashu Wang
cs.AI

papers.abstract

Bien que les agents basés sur des modèles de langage de grande taille (LLM) montrent un potentiel dans le trading automatisé, ils rencontrent encore des limitations critiques. Les cadres multi-agents les plus répandus souffrent souvent d'inefficacité, produisent des signaux incohérents et manquent d'optimisation de bout en bout nécessaire pour apprendre une stratégie cohérente à partir des retours du marché. Pour remédier à cela, nous présentons AlphaQuanter, un cadre mono-agent qui utilise l'apprentissage par renforcement (RL) pour apprendre une politique dynamique sur un flux de décision transparent et augmenté par des outils. Cela permet à un seul agent d'orchestrer de manière autonome les outils et d'acquérir proactivement des informations à la demande, établissant ainsi un processus de raisonnement transparent et vérifiable. Des expériences approfondies démontrent qu'AlphaQuanter atteint des performances de pointe sur des indicateurs financiers clés. De plus, son raisonnement interprétable révèle des stratégies sophistiquées, offrant des insights novateurs et précieux pour les traders humains. Notre code pour l'acquisition de données et l'entraînement de l'agent est disponible publiquement à l'adresse suivante : https://github.com/AlphaQuanter/AlphaQuanter.
English
While Large Language Model (LLM) agents show promise in automated trading, they still face critical limitations. Prominent multi-agent frameworks often suffer from inefficiency, produce inconsistent signals, and lack the end-to-end optimization required to learn a coherent strategy from market feedback. To address this, we introduce AlphaQuanter, a single-agent framework that uses reinforcement learning (RL) to learn a dynamic policy over a transparent, tool-augmented decision workflow, which empowers a single agent to autonomously orchestrate tools and proactively acquire information on demand, establishing a transparent and auditable reasoning process. Extensive experiments demonstrate that AlphaQuanter achieves state-of-the-art performance on key financial metrics. Moreover, its interpretable reasoning reveals sophisticated strategies, offering novel and valuable insights for human traders. Our code for data acquisition and agent training is publicly available at: https://github.com/AlphaQuanter/AlphaQuanter
PDF72October 22, 2025