ChatPaper.aiChatPaper

AlphaQuanter: Un Framework di Apprendimento per Rinforzo Agente-Orchestrato End-to-End per il Trading Azionario

AlphaQuanter: An End-to-End Tool-Orchestrated Agentic Reinforcement Learning Framework for Stock Trading

October 16, 2025
Autori: Zheye Deng, Jiashu Wang
cs.AI

Abstract

Sebbene gli agenti basati su Large Language Model (LLM) mostrino potenziale nel trading automatizzato, devono ancora affrontare limitazioni critiche. I principali framework multi-agente spesso soffrono di inefficienza, producono segnali incoerenti e mancano dell'ottimizzazione end-to-end necessaria per apprendere una strategia coerente dal feedback del mercato. Per affrontare queste problematiche, introduciamo AlphaQuanter, un framework single-agent che utilizza il reinforcement learning (RL) per apprendere una politica dinamica su un flusso decisionale trasparente e potenziato da strumenti, consentendo a un singolo agente di orchestrare autonomamente gli strumenti e acquisire proattivamente informazioni su richiesta, stabilendo un processo di ragionamento trasparente e verificabile. Esperimenti estensivi dimostrano che AlphaQuanter raggiunge prestazioni all'avanguardia su metriche finanziarie chiave. Inoltre, il suo ragionamento interpretabile rivela strategie sofisticate, offrendo nuove e preziose intuizioni per i trader umani. Il nostro codice per l'acquisizione dei dati e l'addestramento dell'agente è disponibile pubblicamente all'indirizzo: https://github.com/AlphaQuanter/AlphaQuanter
English
While Large Language Model (LLM) agents show promise in automated trading, they still face critical limitations. Prominent multi-agent frameworks often suffer from inefficiency, produce inconsistent signals, and lack the end-to-end optimization required to learn a coherent strategy from market feedback. To address this, we introduce AlphaQuanter, a single-agent framework that uses reinforcement learning (RL) to learn a dynamic policy over a transparent, tool-augmented decision workflow, which empowers a single agent to autonomously orchestrate tools and proactively acquire information on demand, establishing a transparent and auditable reasoning process. Extensive experiments demonstrate that AlphaQuanter achieves state-of-the-art performance on key financial metrics. Moreover, its interpretable reasoning reveals sophisticated strategies, offering novel and valuable insights for human traders. Our code for data acquisition and agent training is publicly available at: https://github.com/AlphaQuanter/AlphaQuanter
PDF72October 22, 2025