Paper2Code : Automatisation de la génération de code à partir d'articles scientifiques en apprentissage automatiquePaper2Code: Automating Code Generation from Scientific Papers in Machine
Learning
MalgrĂ© la croissance rapide de la recherche en apprentissage automatique, les implĂ©mentations de code correspondantes sont souvent indisponibles, rendant la reproduction des rĂ©sultats et la construction sur des travaux antĂ©rieurs lentes et laborieuses pour les chercheurs. ParallĂšlement, les modĂšles de langage de grande taille (LLMs) rĂ©cents excellent dans la comprĂ©hension des documents scientifiques et la gĂ©nĂ©ration de code de haute qualitĂ©. InspirĂ©s par cela, nous introduisons PaperCoder, un framework multi-agent basĂ© sur des LLMs qui transforme les articles d'apprentissage automatique en dĂ©pĂŽts de code fonctionnels. PaperCoder opĂšre en trois Ă©tapes : la planification, oĂč il construit une feuille de route de haut niveau, conçoit l'architecture du systĂšme avec des diagrammes, identifie les dĂ©pendances de fichiers et gĂ©nĂšre des fichiers de configuration ; l'analyse, qui se concentre sur l'interprĂ©tation des dĂ©tails spĂ©cifiques Ă l'implĂ©mentation ; et la gĂ©nĂ©ration, oĂč un code modulaire et conscient des dĂ©pendances est produit. De plus, chaque phase est instanciĂ©e par un ensemble d'agents spĂ©cialisĂ©s conçus pour collaborer efficacement tout au long du pipeline. Nous Ă©valuons ensuite PaperCoder sur la gĂ©nĂ©ration d'implĂ©mentations de code Ă partir d'articles d'apprentissage automatique en nous basant sur des Ă©valuations Ă la fois basĂ©es sur des modĂšles et humaines, spĂ©cifiquement celles des auteurs originaux des articles, avec les dĂ©pĂŽts publiĂ©s par les auteurs comme vĂ©ritĂ© de rĂ©fĂ©rence lorsqu'ils sont disponibles. Nos rĂ©sultats dĂ©montrent l'efficacitĂ© de PaperCoder Ă crĂ©er des implĂ©mentations de haute qualitĂ© et fidĂšles. De plus, il montre systĂ©matiquement des forces dans le benchmark rĂ©cemment publiĂ© PaperBench, surpassant les bases de rĂ©fĂ©rence solides par des marges substantielles.