Le Scientifique IA : Vers une Découverte Scientifique Ouverte et Entièrement Automatisée
The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery
August 12, 2024
Auteurs: Chris Lu, Cong Lu, Robert Tjarko Lange, Jakob Foerster, Jeff Clune, David Ha
cs.AI
Résumé
L'un des grands défis de l'intelligence artificielle générale est de développer des agents capables de mener des recherches scientifiques et de découvrir de nouvelles connaissances. Bien que les modèles de pointe aient déjà été utilisés comme outils d'assistance pour les scientifiques humains, par exemple pour le brainstorming d'idées, l'écriture de code ou les tâches de prédiction, ils ne réalisent encore qu'une petite partie du processus scientifique. Cet article présente le premier cadre complet pour la découverte scientifique entièrement automatique, permettant aux grands modèles de langage de pointe de mener des recherches de manière indépendante et de communiquer leurs résultats. Nous introduisons L'IA Scientifique, qui génère des idées de recherche novatrices, écrit du code, exécute des expériences, visualise les résultats, décrit ses découvertes en rédigeant un article scientifique complet, puis exécute un processus de revue simulé pour évaluation. En principe, ce processus peut être répété pour développer des idées de manière itérative et ouverte, à l'image de la communauté scientifique humaine. Nous démontrons sa polyvalence en l'appliquant à trois sous-domaines distincts de l'apprentissage automatique : la modélisation par diffusion, la modélisation linguistique basée sur les transformateurs et la dynamique d'apprentissage. Chaque idée est implémentée et développée en un article complet à un coût inférieur à 15 dollars par article. Pour évaluer les articles générés, nous concevons et validons un relecteur automatisé, qui atteint des performances quasi humaines dans l'évaluation des scores des articles. L'IA Scientifique peut produire des articles qui dépassent le seuil d'acceptation d'une conférence de premier plan en apprentissage automatique, selon notre relecteur automatisé. Cette approche marque le début d'une nouvelle ère dans la découverte scientifique en apprentissage automatique : apporter les avantages transformateurs des agents d'IA à l'ensemble du processus de recherche en IA elle-même, et nous rapprocher d'un monde où une créativité et une innovation abordables et sans fin peuvent être déployées sur les problèmes les plus complexes au monde. Notre code est open-source à l'adresse https://github.com/SakanaAI/AI-Scientist.
English
One of the grand challenges of artificial general intelligence is developing
agents capable of conducting scientific research and discovering new knowledge.
While frontier models have already been used as aids to human scientists, e.g.
for brainstorming ideas, writing code, or prediction tasks, they still conduct
only a small part of the scientific process. This paper presents the first
comprehensive framework for fully automatic scientific discovery, enabling
frontier large language models to perform research independently and
communicate their findings. We introduce The AI Scientist, which generates
novel research ideas, writes code, executes experiments, visualizes results,
describes its findings by writing a full scientific paper, and then runs a
simulated review process for evaluation. In principle, this process can be
repeated to iteratively develop ideas in an open-ended fashion, acting like the
human scientific community. We demonstrate its versatility by applying it to
three distinct subfields of machine learning: diffusion modeling,
transformer-based language modeling, and learning dynamics. Each idea is
implemented and developed into a full paper at a cost of less than $15 per
paper. To evaluate the generated papers, we design and validate an automated
reviewer, which we show achieves near-human performance in evaluating paper
scores. The AI Scientist can produce papers that exceed the acceptance
threshold at a top machine learning conference as judged by our automated
reviewer. This approach signifies the beginning of a new era in scientific
discovery in machine learning: bringing the transformative benefits of AI
agents to the entire research process of AI itself, and taking us closer to a
world where endless affordable creativity and innovation can be unleashed on
the world's most challenging problems. Our code is open-sourced at
https://github.com/SakanaAI/AI-ScientistSummary
AI-Generated Summary