Paper2Code:自动化生成机器学习领域科学论文的代码Paper2Code: Automating Code Generation from Scientific Papers in Machine
Learning
尽管机器学习研究发展迅速,但相应的代码实现往往难以获取,这使得研究人员在复现结果和基于前人工作构建时既耗时又费力。与此同时,近期的大型语言模型(LLMs)在理解科学文献和生成高质量代码方面表现出色。受此启发,我们推出了PaperCoder,一个多智能体LLM框架,旨在将机器学习论文转化为功能完备的代码库。PaperCoder的工作流程分为三个阶段:规划阶段,构建高层次路线图,设计系统架构图,识别文件依赖关系并生成配置文件;分析阶段,专注于解读实现细节;生成阶段,产出模块化、依赖感知的代码。此外,每个阶段均由一组专门设计的智能体实例化,这些智能体在整个流程中高效协作。随后,我们基于模型评估和人类评估(特别是来自原论文作者的评估),以作者发布的代码库为基准(如可获得),对PaperCoder从机器学习论文生成代码实现的能力进行了评估。我们的结果表明,PaperCoder在创建高质量、忠实于原作的实现方面效果显著。此外,在最新发布的PaperBench基准测试中,PaperCoder持续展现出优势,以显著差距超越强基线模型。