DeepCodeSeek: Recupero di API in Tempo Reale per la Generazione di Codice Contesto-Aware

Abstract

Le attuali tecniche di ricerca sono limitate alle applicazioni standard di query-documento RAG. In questo articolo, proponiamo una nuova tecnica per espandere il codice e l'indice per prevedere le API necessarie, abilitando direttamente una generazione di codice end-to-end di alta qualità per applicazioni di auto-completamento e AI agentica. Affrontiamo il problema delle fughe di API nei dataset di benchmark codice-a-codice attuali introducendo un nuovo dataset costruito da Script Includes di ServiceNow del mondo reale che catturano la sfida dell'intento d'uso poco chiaro delle API nel codice. Le nostre metriche di valutazione mostrano che questo metodo raggiunge un'accuratezza di recupero top-40 dell'87,86%, consentendo il contesto critico con le API necessario per una generazione di codice downstream di successo. Per abilitare previsioni in tempo reale, sviluppiamo una pipeline completa di post-addestramento che ottimizza un reranker compatto da 0,6B attraverso la generazione di dataset sintetici, fine-tuning supervisionato e apprendimento per rinforzo. Questo approccio consente al nostro reranker compatto di superare un modello molto più grande da 8B mantenendo una latenza ridotta di 2,5x, affrontando efficacemente le sfumature del codice specifico per le aziende senza il sovraccarico computazionale dei modelli più grandi.

English

Current search techniques are limited to standard RAG query-document applications. In this paper, we propose a novel technique to expand the code and index for predicting the required APIs, directly enabling high-quality, end-to-end code generation for auto-completion and agentic AI applications. We address the problem of API leaks in current code-to-code benchmark datasets by introducing a new dataset built from real-world ServiceNow Script Includes that capture the challenge of unclear API usage intent in the code. Our evaluation metrics show that this method achieves 87.86% top-40 retrieval accuracy, allowing the critical context with APIs needed for successful downstream code generation. To enable real-time predictions, we develop a comprehensive post-training pipeline that optimizes a compact 0.6B reranker through synthetic dataset generation, supervised fine-tuning, and reinforcement learning. This approach enables our compact reranker to outperform a much larger 8B model while maintaining 2.5x reduced latency, effectively addressing the nuances of enterprise-specific code without the computational overhead of larger models.

DeepCodeSeek: Recupero di API in Tempo Reale per la Generazione di Codice Contesto-Aware

DeepCodeSeek: Real-Time API Retrieval for Context-Aware Code Generation

Abstract

Support