DeepCodeSeek: Echtzeit-API-Retrieval für kontextbewusste Code-Generierung
DeepCodeSeek: Real-Time API Retrieval for Context-Aware Code Generation
September 30, 2025
papers.authors: Esakkivel Esakkiraja, Denis Akhiyarov, Aditya Shanmugham, Chitra Ganapathy
cs.AI
papers.abstract
Aktuelle Suchtechniken beschränken sich auf Standard-RAG-Anwendungen für Abfragen und Dokumente. In diesem Artikel schlagen wir eine neuartige Technik vor, um den Code und den Index für die Vorhersage benötigter APIs zu erweitern, wodurch eine hochwertige, end-to-end Code-Generierung für Auto-Vervollständigung und agentenbasierte KI-Anwendungen direkt ermöglicht wird. Wir adressieren das Problem von API-Leaks in aktuellen Code-zu-Code-Benchmark-Datensätzen durch die Einführung eines neuen Datensatzes, der aus realen ServiceNow Script Includes erstellt wurde und die Herausforderung unklarer API-Nutzungsabsichten im Code erfasst. Unsere Evaluationsmetriken zeigen, dass diese Methode eine Top-40-Retrieval-Genauigkeit von 87,86 % erreicht, wodurch der kritische Kontext mit APIs bereitgestellt wird, der für eine erfolgreiche nachgelagerte Code-Generierung erforderlich ist. Um Echtzeitvorhersagen zu ermöglichen, entwickeln wir eine umfassende Post-Training-Pipeline, die einen kompakten 0,6B-Reranker durch synthetische Datensatzgenerierung, überwachtes Fein-Tuning und Reinforcement Learning optimiert. Dieser Ansatz ermöglicht es unserem kompakten Reranker, ein viel größeres 8B-Modell zu übertreffen, während die Latenz um das 2,5-fache reduziert wird, wodurch die Nuancen unternehmensspezifischer Codes effektiv adressiert werden, ohne den Rechenaufwand größerer Modelle in Kauf nehmen zu müssen.
English
Current search techniques are limited to standard RAG query-document
applications. In this paper, we propose a novel technique to expand the code
and index for predicting the required APIs, directly enabling high-quality,
end-to-end code generation for auto-completion and agentic AI applications. We
address the problem of API leaks in current code-to-code benchmark datasets by
introducing a new dataset built from real-world ServiceNow Script Includes that
capture the challenge of unclear API usage intent in the code. Our evaluation
metrics show that this method achieves 87.86% top-40 retrieval accuracy,
allowing the critical context with APIs needed for successful downstream code
generation. To enable real-time predictions, we develop a comprehensive
post-training pipeline that optimizes a compact 0.6B reranker through synthetic
dataset generation, supervised fine-tuning, and reinforcement learning. This
approach enables our compact reranker to outperform a much larger 8B model
while maintaining 2.5x reduced latency, effectively addressing the nuances of
enterprise-specific code without the computational overhead of larger models.