Grafici della Conoscenza Eseguibili per la Replicazione della Ricerca sull'Intelligenza Artificiale
Executable Knowledge Graphs for Replicating AI Research
October 20, 2025
Autori: Yujie Luo, Zhuoyun Yu, Xuehai Wang, Yuqi Zhu, Ningyu Zhang, Lanning Wei, Lun Du, Da Zheng, Huajun Chen
cs.AI
Abstract
Replicare la ricerca sull'IA è un compito cruciale ma impegnativo per gli agenti basati su modelli linguistici di grandi dimensioni (LLM). Gli approcci esistenti spesso incontrano difficoltà nel generare codice eseguibile, principalmente a causa di una conoscenza di base insufficiente e delle limitazioni dei metodi di generazione aumentata con recupero (RAG), che non riescono a catturare i dettagli tecnici latenti nascosti nei documenti di riferimento. Inoltre, i precedenti approcci tendono a trascurare preziosi segnali di codice a livello di implementazione e mancano di rappresentazioni strutturate della conoscenza che supportino il recupero e il riutilizzo multi-granulare. Per superare queste sfide, proponiamo i Grafi di Conoscenza Eseguibili (xKG), una base di conoscenza modulare e pluggable che integra automaticamente intuizioni tecniche, frammenti di codice e conoscenze specifiche del dominio estratte dalla letteratura scientifica. Quando integrato in tre framework di agenti con due diversi LLM, xKG mostra miglioramenti significativi delle prestazioni (10,9% con o3-mini) su PaperBench, dimostrando la sua efficacia come soluzione generale ed estensibile per la replicazione automatizzata della ricerca sull'IA. Il codice sarà rilasciato su https://github.com/zjunlp/xKG.
English
Replicating AI research is a crucial yet challenging task for large language
model (LLM) agents. Existing approaches often struggle to generate executable
code, primarily due to insufficient background knowledge and the limitations of
retrieval-augmented generation (RAG) methods, which fail to capture latent
technical details hidden in referenced papers. Furthermore, previous approaches
tend to overlook valuable implementation-level code signals and lack structured
knowledge representations that support multi-granular retrieval and reuse. To
overcome these challenges, we propose Executable Knowledge Graphs (xKG), a
modular and pluggable knowledge base that automatically integrates technical
insights, code snippets, and domain-specific knowledge extracted from
scientific literature. When integrated into three agent frameworks with two
different LLMs, xKG shows substantial performance gains (10.9% with o3-mini) on
PaperBench, demonstrating its effectiveness as a general and extensible
solution for automated AI research replication. Code will released at
https://github.com/zjunlp/xKG.