MIGA: Mixture-of-Experts con Aggregazione di Gruppo per la Predizione del Mercato Azionario
MIGA: Mixture-of-Experts with Group Aggregation for Stock Market Prediction
October 3, 2024
Autori: Zhaojian Yu, Yinghao Wu, Genesis Wang, Heming Weng
cs.AI
Abstract
La previsione del mercato azionario è rimasta un problema estremamente impegnativo per molte decadi a causa della sua intrinseca alta volatilità e basso rapporto rumoroso di informazioni. Le soluzioni esistenti basate sull'apprendimento automatico o sul deep learning dimostrano prestazioni superiori impiegando un singolo modello addestrato sull'intero dataset azionario per generare previsioni su tutti i tipi di azioni. Tuttavia, a causa delle significative variazioni nello stile delle azioni e nelle tendenze di mercato, un singolo modello end-to-end fatica a catturare appieno le differenze in queste caratteristiche stilizzate delle azioni, portando a previsioni relativamente inaccurate per tutti i tipi di azioni. In questo articolo, presentiamo MIGA, un nuovo framework Mixture of Expert con aggregazione di gruppo progettato per generare previsioni specializzate per azioni con stili diversi passando dinamicamente tra esperti di stili distinti. Per promuovere la collaborazione tra diversi esperti in MIGA, proponiamo un'innovativa architettura di attenzione interna di gruppo, consentendo agli esperti dello stesso gruppo di condividere informazioni e migliorare così le prestazioni complessive di tutti gli esperti. Di conseguenza, MIGA supera significativamente altri modelli end-to-end su tre benchmark degli indici azionari cinesi tra cui CSI300, CSI500 e CSI1000. In particolare, MIGA-Conv raggiunge un rendimento annuo eccedente del 24% sul benchmark CSI300, superando il modello precedente all'avanguardia del 8% in termini assoluti. Inoltre, conduciamo un'analisi esaustiva del mixture of experts per la previsione del mercato azionario, fornendo preziose intuizioni per la ricerca futura.
English
Stock market prediction has remained an extremely challenging problem for
many decades owing to its inherent high volatility and low information noisy
ratio. Existing solutions based on machine learning or deep learning
demonstrate superior performance by employing a single model trained on the
entire stock dataset to generate predictions across all types of stocks.
However, due to the significant variations in stock styles and market trends, a
single end-to-end model struggles to fully capture the differences in these
stylized stock features, leading to relatively inaccurate predictions for all
types of stocks. In this paper, we present MIGA, a novel Mixture of Expert with
Group Aggregation framework designed to generate specialized predictions for
stocks with different styles by dynamically switching between distinct style
experts. To promote collaboration among different experts in MIGA, we propose a
novel inner group attention architecture, enabling experts within the same
group to share information and thereby enhancing the overall performance of all
experts. As a result, MIGA significantly outperforms other end-to-end models on
three Chinese Stock Index benchmarks including CSI300, CSI500, and CSI1000.
Notably, MIGA-Conv reaches 24 % excess annual return on CSI300 benchmark,
surpassing the previous state-of-the-art model by 8% absolute. Furthermore, we
conduct a comprehensive analysis of mixture of experts for stock market
prediction, providing valuable insights for future research.