DeepCodeSeek: Echtzeit-API-Retrieval für kontextbewusste Code-Generierung

papers.abstract

Aktuelle Suchtechniken beschränken sich auf Standard-RAG-Anwendungen für Abfragen und Dokumente. In diesem Artikel schlagen wir eine neuartige Technik vor, um den Code und den Index für die Vorhersage benötigter APIs zu erweitern, wodurch eine hochwertige, end-to-end Code-Generierung für Auto-Vervollständigung und agentenbasierte KI-Anwendungen direkt ermöglicht wird. Wir adressieren das Problem von API-Leaks in aktuellen Code-zu-Code-Benchmark-Datensätzen durch die Einführung eines neuen Datensatzes, der aus realen ServiceNow Script Includes erstellt wurde und die Herausforderung unklarer API-Nutzungsabsichten im Code erfasst. Unsere Evaluationsmetriken zeigen, dass diese Methode eine Top-40-Retrieval-Genauigkeit von 87,86 % erreicht, wodurch der kritische Kontext mit APIs bereitgestellt wird, der für eine erfolgreiche nachgelagerte Code-Generierung erforderlich ist. Um Echtzeitvorhersagen zu ermöglichen, entwickeln wir eine umfassende Post-Training-Pipeline, die einen kompakten 0,6B-Reranker durch synthetische Datensatzgenerierung, überwachtes Fein-Tuning und Reinforcement Learning optimiert. Dieser Ansatz ermöglicht es unserem kompakten Reranker, ein viel größeres 8B-Modell zu übertreffen, während die Latenz um das 2,5-fache reduziert wird, wodurch die Nuancen unternehmensspezifischer Codes effektiv adressiert werden, ohne den Rechenaufwand größerer Modelle in Kauf nehmen zu müssen.

English

Current search techniques are limited to standard RAG query-document applications. In this paper, we propose a novel technique to expand the code and index for predicting the required APIs, directly enabling high-quality, end-to-end code generation for auto-completion and agentic AI applications. We address the problem of API leaks in current code-to-code benchmark datasets by introducing a new dataset built from real-world ServiceNow Script Includes that capture the challenge of unclear API usage intent in the code. Our evaluation metrics show that this method achieves 87.86% top-40 retrieval accuracy, allowing the critical context with APIs needed for successful downstream code generation. To enable real-time predictions, we develop a comprehensive post-training pipeline that optimizes a compact 0.6B reranker through synthetic dataset generation, supervised fine-tuning, and reinforcement learning. This approach enables our compact reranker to outperform a much larger 8B model while maintaining 2.5x reduced latency, effectively addressing the nuances of enterprise-specific code without the computational overhead of larger models.

DeepCodeSeek: Echtzeit-API-Retrieval für kontextbewusste Code-Generierung

DeepCodeSeek: Real-Time API Retrieval for Context-Aware Code Generation

papers.abstract

Support