ChatPaper.aiChatPaper

Co-mathématicien IA : Accélérer les travaux des mathématiciens grâce à l'IA agentique

AI Co-Mathematician: Accelerating Mathematicians with Agentic AI

May 7, 2026
Auteurs: Daniel Zheng, Ingrid von Glehn, Yori Zwols, Iuliya Beloshapka, Lars Buesing, Daniel M. Roy, Martin Wattenberg, Bogdan Georgiev, Tatiana Schmidt, Andrew Cowie, Fernanda Viegas, Dimitri Kanevsky, Vineet Kahlon, Hartmut Maennel, Sophia Alj, George Holland, Alex Davies, Pushmeet Kohli
cs.AI

Résumé

Nous présentons le co-mathématicien IA, un environnement de travail permettant aux mathématiciens d'utiliser de manière interactive des agents d'IA pour mener des recherches ouvertes. Le co-mathématicien IA est optimisé pour fournir un soutien holistique à la réalité exploratoire et itérative des workflows mathématiques, incluant l'idéation, la recherche documentaire, l'exploration computationnelle, la démonstration de théorèmes et la construction théorique. En fournissant un espace de travail asynchrone et persistant qui gère l'incertitude, affine l'intention de l'utilisateur, suit les hypothèses infructueuses et produit des artefacts mathématiques natifs, le système reflète les workflows de collaboration humaine. Lors de tests précoces, le co-mathématicien IA a aidé des chercheurs à résoudre des problèmes ouverts, à identifier de nouvelles directions de recherche et à découvrir des références bibliographiques négligées. Outre la démonstration d'un paradigme hautement interactif pour la découverte mathématique assistée par l'IA, le co-mathématicien IA obtient également des résultats de pointe sur des benchmarks de résolution de problèmes difficiles, notamment un score de 48 % sur FrontierMath Niveau 4, établissant un nouveau record parmi tous les systèmes d'IA évalués.
English
We introduce the AI co-mathematician, a workbench for mathematicians to interactively leverage AI agents to pursue open-ended research. The AI co-mathematician is optimized to provide holistic support for the exploratory and iterative reality of mathematical workflows, including ideation, literature search, computational exploration, theorem proving and theory building. By providing an asynchronous, stateful workspace that manages uncertainty, refines user intent, tracks failed hypotheses, and outputs native mathematical artifacts, the system mirrors human collaborative workflows. In early tests, the AI co-mathematician helped researchers solve open problems, identify new research directions, and uncover overlooked literature references. Besides demonstrating a highly interactive paradigm for AI-assisted mathematical discovery, the AI co-mathematician also achieves state of the art results on hard problem-solving benchmarks, including scoring 48% on FrontierMath Tier 4, a new high score among all AI systems evaluated.
PDF51May 9, 2026