Non Recuperare, Naviga: Distillare la Conoscenza Aziendale in Competenze Agenti Navigabili per QA e RAG

Abstract

La Generazione Aumentata dal Recupero (RAG) basa le risposte degli LLM su evidenze esterne, ma tratta il modello come un consumatore passivo dei risultati di ricerca: non vede mai come il corpus è organizzato o cosa non ha ancora recuperato, limitando la sua capacità di tornare indietro o combinare prove sparse. Presentiamo Corpus2Skill, che distilla un corpus documentale in una directory gerarchica di competenze in modalità offline e consente a un agente LLM di navigarla durante il servizio. La pipeline di compilazione clusterizza iterativamente i documenti, genera riassunti scritti dall'LLM a ogni livello e materializza il risultato come un albero di file di competenze navigabili. Durante il servizio, l'agente riceve una visione d'insieme del corpus, si addentra nei rami tematici attraverso riassunti progressivamente più dettagliati e recupera i documenti completi tramite ID. Poiché la gerarchia è esplicitamente visibile, l'agente può ragionare su dove cercare, tornare indietro da percorsi infruttuosi e combinare prove tra diversi rami. Su WixQA, un benchmark aziendale di assistenza clienti per RAG, Corpus2Skill supera il recupero denso, RAPTOR e i baseline RAG agentici in tutte le metriche di qualità.

English

Retrieval-Augmented Generation (RAG) grounds LLM responses in external evidence but treats the model as a passive consumer of search results: it never sees how the corpus is organized or what it has not yet retrieved, limiting its ability to backtrack or combine scattered evidence. We present Corpus2Skill, which distills a document corpus into a hierarchical skill directory offline and lets an LLM agent navigate it at serve time. The compilation pipeline iteratively clusters documents, generates LLM-written summaries at each level, and materializes the result as a tree of navigable skill files. At serve time, the agent receives a bird's-eye view of the corpus, drills into topic branches via progressively finer summaries, and retrieves full documents by ID. Because the hierarchy is explicitly visible, the agent can reason about where to look, backtrack from unproductive paths, and combine evidence across branches. On WixQA, an enterprise customer-support benchmark for RAG, Corpus2Skill outperforms dense retrieval, RAPTOR, and agentic RAG baselines across all quality metrics.

Non Recuperare, Naviga: Distillare la Conoscenza Aziendale in Competenze Agenti Navigabili per QA e RAG

Don't Retrieve, Navigate: Distilling Enterprise Knowledge into Navigable Agent Skills for QA and RAG

Abstract

Support