KI-Mathematiker: Mathematiker mit agentenbasierter KI beschleunigen
AI Co-Mathematician: Accelerating Mathematicians with Agentic AI
May 7, 2026
Autoren: Daniel Zheng, Ingrid von Glehn, Yori Zwols, Iuliya Beloshapka, Lars Buesing, Daniel M. Roy, Martin Wattenberg, Bogdan Georgiev, Tatiana Schmidt, Andrew Cowie, Fernanda Viegas, Dimitri Kanevsky, Vineet Kahlon, Hartmut Maennel, Sophia Alj, George Holland, Alex Davies, Pushmeet Kohli
cs.AI
Zusammenfassung
Wir stellen den KI-Mathematik-Assistenten vor, eine Arbeitsplattform für Mathematiker, um interaktiv KI-Agenten zur Verfolgung offener Forschungsvorhaben einzusetzen. Der KI-Mathematik-Assistent ist darauf ausgelegt, ganzheitliche Unterstützung für die explorative und iterative Realität mathematischer Arbeitsabläufe zu bieten, einschließlich Ideenfindung, Literaturrecherche, computergestützter Exploration, Theorembeweis und Theoriebildung. Durch einen asynchronen, zustandsbehafteten Arbeitsbereich, der Unsicherheiten verwaltet, Benutzerabsichten verfeinert, gescheiterte Hypothesen nachverfolgt und native mathematische Artefakte ausgibt, spiegelt das System menschliche kollaborative Arbeitsprozesse wider. In ersten Tests half der KI-Mathematik-Assistent Forschern bei der Lösung offener Probleme, der Identifizierung neuer Forschungsrichtungen und der Entdeckung übersehener Literaturreferenzen. Neben der Demonstration eines hochinteraktiven Paradigmas für KI-gestützte mathematische Entdeckungen erzielt der KI-Mathematik-Assistent zudem state-of-the-Art-Ergebnisse in anspruchsvollen Problemlösungs-Benchmarks, einschließlich einer Bewertung von 48 % auf FrontierMath Tier 4 – ein neuer Höchstwert unter allen evaluierten KI-Systemen.
English
We introduce the AI co-mathematician, a workbench for mathematicians to interactively leverage AI agents to pursue open-ended research. The AI co-mathematician is optimized to provide holistic support for the exploratory and iterative reality of mathematical workflows, including ideation, literature search, computational exploration, theorem proving and theory building. By providing an asynchronous, stateful workspace that manages uncertainty, refines user intent, tracks failed hypotheses, and outputs native mathematical artifacts, the system mirrors human collaborative workflows. In early tests, the AI co-mathematician helped researchers solve open problems, identify new research directions, and uncover overlooked literature references. Besides demonstrating a highly interactive paradigm for AI-assisted mathematical discovery, the AI co-mathematician also achieves state of the art results on hard problem-solving benchmarks, including scoring 48% on FrontierMath Tier 4, a new high score among all AI systems evaluated.