QuantaAlpha: Un Marco Evolutivo para la Minería de Alfa Impulsada por Modelos de Lenguaje Grande
QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining
February 6, 2026
Autores: Jun Han, Shuo Zhang, Wei Li, Zhi Yang, Yifan Dong, Tu Hu, Jialuo Yuan, Xiaomin Yu, Yumo Zhu, Fangqi Lou, Xin Guo, Zhaowei Liu, Tianyi Jiang, Ruichuan An, Jingping Liu, Biao Wu, Rongze Chen, Kunyi Wang, Yifan Wang, Sen Hu, Xinbing Kong, Liwen Zhang, Ronghao Chen, Huacan Wang
cs.AI
Resumen
Los mercados financieros son ruidosos y no estacionarios, lo que hace que la minería de alfas sea altamente sensible al ruido en los resultados de backtesting y a los cambios repentinos de régimen de mercado. Si bien los marcos agentes recientes mejoran la automatización de la minería de alfas, a menudo carecen de búsqueda multirronda controlable y reutilización confiable de experiencia validada. Para abordar estos desafíos, proponemos QuantaAlpha, un marco evolutivo de minería de alfas que trata cada ejecución de minería de extremo a extremo como una trayectoria y mejora los factores mediante operaciones de mutación y cruce a nivel de trayectoria. QuantaAlpha localiza los pasos subóptimos en cada trayectoria para su revisión dirigida y recomienda segmentos complementarios de alta recompensa para reutilizar patrones efectivos, permitiendo una exploración y refinamiento estructurados a través de iteraciones de minería. Durante la generación de factores, QuantaAlpha aplica consistencia semántica entre la hipótesis, la expresión del factor y el código ejecutable, mientras restringe la complejidad y redundancia del factor generado para mitigar el hacinamiento (crowding). Experimentos exhaustivos en el Índice de Valores de China 300 (CSI 300) demuestran ganancias consistentes sobre modelos baseline sólidos y sistemas agentes previos. Al utilizar GPT-5.2, QuantaAlpha logra un Coeficiente de Información (IC) de 0.1501, con una Tasa de Retorno Anualizada (ARR) del 27.75% y una Pérdida Máxima (MDD) del 7.98%. Además, los factores minados en el CSI 300 se transfieren efectivamente al Índice de Valores de China 500 (CSI 500) y al Índice Standard & Poor's 500 (S&P 500), generando un exceso de retorno acumulado del 160% y 137% respectivamente durante cuatro años, lo que indica una robustez sólida de QuantaAlpha bajo cambios en la distribución del mercado.
English
Financial markets are noisy and non-stationary, making alpha mining highly sensitive to noise in backtesting results and sudden market regime shifts. While recent agentic frameworks improve alpha mining automation, they often lack controllable multi-round search and reliable reuse of validated experience. To address these challenges, we propose QuantaAlpha, an evolutionary alpha mining framework that treats each end-to-end mining run as a trajectory and improves factors through trajectory-level mutation and crossover operations. QuantaAlpha localizes suboptimal steps in each trajectory for targeted revision and recombines complementary high-reward segments to reuse effective patterns, enabling structured exploration and refinement across mining iterations. During factor generation, QuantaAlpha enforces semantic consistency across the hypothesis, factor expression, and executable code, while constraining the complexity and redundancy of the generated factor to mitigate crowding. Extensive experiments on the China Securities Index 300 (CSI 300) demonstrate consistent gains over strong baseline models and prior agentic systems. When utilizing GPT-5.2, QuantaAlpha achieves an Information Coefficient (IC) of 0.1501, with an Annualized Rate of Return (ARR) of 27.75% and a Maximum Drawdown (MDD) of 7.98%. Moreover, factors mined on CSI 300 transfer effectively to the China Securities Index 500 (CSI 500) and the Standard & Poor's 500 Index (S&P 500), delivering 160% and 137% cumulative excess return over four years, respectively, which indicates strong robustness of QuantaAlpha under market distribution shifts.