Graphes de connaissances exécutables pour la réplication de la recherche en intelligence artificielle
Executable Knowledge Graphs for Replicating AI Research
October 20, 2025
papers.authors: Yujie Luo, Zhuoyun Yu, Xuehai Wang, Yuqi Zhu, Ningyu Zhang, Lanning Wei, Lun Du, Da Zheng, Huajun Chen
cs.AI
papers.abstract
La réplication des recherches en IA constitue une tâche cruciale mais complexe pour les agents de modèles de langage de grande taille (LLM). Les approches existantes peinent souvent à générer du code exécutable, principalement en raison d’un manque de connaissances de fond et des limites des méthodes de génération augmentée par récupération (RAG), qui ne parviennent pas à capturer les détails techniques latents cachés dans les articles référencés. De plus, les approches précédentes ont tendance à négliger les signaux de code précieux au niveau de l’implémentation et manquent de représentations structurées des connaissances permettant une récupération et une réutilisation multi-granulaires. Pour surmonter ces défis, nous proposons les Graphes de Connaissances Exécutables (xKG), une base de connaissances modulaire et plug-and-play qui intègre automatiquement des insights techniques, des extraits de code et des connaissances spécifiques au domaine extraites de la littérature scientifique. Lorsqu’ils sont intégrés dans trois frameworks d’agents avec deux LLM différents, les xKG montrent des gains de performance substantiels (10,9 % avec o3-mini) sur PaperBench, démontrant leur efficacité en tant que solution générale et extensible pour la réplication automatisée des recherches en IA. Le code sera publié sur https://github.com/zjunlp/xKG.
English
Replicating AI research is a crucial yet challenging task for large language
model (LLM) agents. Existing approaches often struggle to generate executable
code, primarily due to insufficient background knowledge and the limitations of
retrieval-augmented generation (RAG) methods, which fail to capture latent
technical details hidden in referenced papers. Furthermore, previous approaches
tend to overlook valuable implementation-level code signals and lack structured
knowledge representations that support multi-granular retrieval and reuse. To
overcome these challenges, we propose Executable Knowledge Graphs (xKG), a
modular and pluggable knowledge base that automatically integrates technical
insights, code snippets, and domain-specific knowledge extracted from
scientific literature. When integrated into three agent frameworks with two
different LLMs, xKG shows substantial performance gains (10.9% with o3-mini) on
PaperBench, demonstrating its effectiveness as a general and extensible
solution for automated AI research replication. Code will released at
https://github.com/zjunlp/xKG.