ASI-Évolue : L'IA accélère l'IA
ASI-Evolve: AI Accelerates AI
March 31, 2026
Auteurs: Weixian Xu, Tiantian Mi, Yixiu Liu, Yang Nan, Zhimeng Zhou, Lyumanshan Ye, Lin Zhang, Yu Qiao, Pengfei Liu
cs.AI
Résumé
L'IA peut-elle accélérer son propre développement ? Si les systèmes agentiels récents ont démontré des performances solides sur des tâches bien délimitées avec un retour rapide, leur capacité à aborder les boucles de recherche coûteuses, à long terme et faiblement supervisées qui sous-tendent les progrès réels de l'IA reste incertaine. Nous présentons ASI-Evolve, un cadre agentiel pour la recherche en IA-pour-l'IA qui referme cette boucle via un cycle apprendre-concevoir-expérimenter-analyser. ASI-Evolve améliore les agents évolutionnistes standards avec deux composants clés : une base de cognition qui injecte des préjugés humains accumulés dans chaque round d'exploration, et un analyseur dédié qui distille les résultats expérimentaux complexes en insights réutilisables pour les itérations futures. À notre connaissance, ASI-Evolve est le premier cadre unifié à démontrer une découverte pilotée par l'IA à travers trois composants centraux du développement de l'IA : les données, les architectures et les algorithmes d'apprentissage. Dans la conception d'architectures neuronales, il a découvert 105 architectures d'attention linéaire à l'état de l'art, le meilleur modèle découvert surpassant DeltaNet de +0,97 point, soit près de 3 fois le gain des améliorations récentes conçues par l'homme. Dans la curation de données de pré-entraînement, le pipeline évolué améliore les performances moyennes de référence de +3,96 points, avec des gains dépassant 18 points sur MMLU. Dans la conception d'algorithmes d'apprentissage par renforcement, les algorithmes découverts surpassent GRPO jusqu'à +12,5 points sur AMC32, +11,67 points sur AIME24 et +5,04 points sur OlympiadBench. Nous fournissons en outre des preuves initiales que ce paradigme IA-pour-l'IA peut se transférer au-delà de la pile IA via des expériences en mathématiques et biomédecine. Ensemble, ces résultats suggèrent qu'ASI-Evolve représente une étape prometteuse vers la capacité de l'IA à accélérer l'IA à travers les étapes fondamentales du développement, offrant des preuves précoces de la faisabilité de la recherche en IA en boucle fermée.
English
Can AI accelerate the development of AI itself? While recent agentic systems have shown strong performance on well-scoped tasks with rapid feedback, it remains unclear whether they can tackle the costly, long-horizon, and weakly supervised research loops that drive real AI progress. We present ASI-Evolve, an agentic framework for AI-for-AI research that closes this loop through a learn-design-experiment-analyze cycle. ASI-Evolve augments standard evolutionary agents with two key components: a cognition base that injects accumulated human priors into each round of exploration, and a dedicated analyzer that distills complex experimental outcomes into reusable insights for future iterations. To our knowledge, ASI-Evolve is the first unified framework to demonstrate AI-driven discovery across three central components of AI development: data, architectures, and learning algorithms. In neural architecture design, it discovered 105 SOTA linear attention architectures, with the best discovered model surpassing DeltaNet by +0.97 points, nearly 3x the gain of recent human-designed improvements. In pretraining data curation, the evolved pipeline improves average benchmark performance by +3.96 points, with gains exceeding 18 points on MMLU. In reinforcement learning algorithm design, discovered algorithms outperform GRPO by up to +12.5 points on AMC32, +11.67 points on AIME24, and +5.04 points on OlympiadBench. We further provide initial evidence that this AI-for-AI paradigm can transfer beyond the AI stack through experiments in mathematics and biomedicine. Together, these results suggest that ASI-Evolve represents a promising step toward enabling AI to accelerate AI across the foundational stages of development, offering early evidence for the feasibility of closed-loop AI research.