DeepCodeSeek: Recupero di API in Tempo Reale per la Generazione di Codice Contesto-Aware
DeepCodeSeek: Real-Time API Retrieval for Context-Aware Code Generation
September 30, 2025
Autori: Esakkivel Esakkiraja, Denis Akhiyarov, Aditya Shanmugham, Chitra Ganapathy
cs.AI
Abstract
Le attuali tecniche di ricerca sono limitate alle applicazioni standard di query-documento RAG. In questo articolo, proponiamo una nuova tecnica per espandere il codice e l'indice per prevedere le API necessarie, abilitando direttamente una generazione di codice end-to-end di alta qualità per applicazioni di auto-completamento e AI agentica. Affrontiamo il problema delle fughe di API nei dataset di benchmark codice-a-codice attuali introducendo un nuovo dataset costruito da Script Includes di ServiceNow del mondo reale che catturano la sfida dell'intento d'uso poco chiaro delle API nel codice. Le nostre metriche di valutazione mostrano che questo metodo raggiunge un'accuratezza di recupero top-40 dell'87,86%, consentendo il contesto critico con le API necessario per una generazione di codice downstream di successo. Per abilitare previsioni in tempo reale, sviluppiamo una pipeline completa di post-addestramento che ottimizza un reranker compatto da 0,6B attraverso la generazione di dataset sintetici, fine-tuning supervisionato e apprendimento per rinforzo. Questo approccio consente al nostro reranker compatto di superare un modello molto più grande da 8B mantenendo una latenza ridotta di 2,5x, affrontando efficacemente le sfumature del codice specifico per le aziende senza il sovraccarico computazionale dei modelli più grandi.
English
Current search techniques are limited to standard RAG query-document
applications. In this paper, we propose a novel technique to expand the code
and index for predicting the required APIs, directly enabling high-quality,
end-to-end code generation for auto-completion and agentic AI applications. We
address the problem of API leaks in current code-to-code benchmark datasets by
introducing a new dataset built from real-world ServiceNow Script Includes that
capture the challenge of unclear API usage intent in the code. Our evaluation
metrics show that this method achieves 87.86% top-40 retrieval accuracy,
allowing the critical context with APIs needed for successful downstream code
generation. To enable real-time predictions, we develop a comprehensive
post-training pipeline that optimizes a compact 0.6B reranker through synthetic
dataset generation, supervised fine-tuning, and reinforcement learning. This
approach enables our compact reranker to outperform a much larger 8B model
while maintaining 2.5x reduced latency, effectively addressing the nuances of
enterprise-specific code without the computational overhead of larger models.