ChatPaper.aiChatPaper

DeepCodeSeek : Récupération d'API en temps réel pour la génération de code contextuel

DeepCodeSeek: Real-Time API Retrieval for Context-Aware Code Generation

September 30, 2025
papers.authors: Esakkivel Esakkiraja, Denis Akhiyarov, Aditya Shanmugham, Chitra Ganapathy
cs.AI

papers.abstract

Les techniques de recherche actuelles se limitent aux applications standard de requête-document RAG. Dans cet article, nous proposons une nouvelle technique pour étendre le code et l'index afin de prédire les API nécessaires, permettant ainsi directement une génération de code de haute qualité, de bout en bout, pour les applications de complétion automatique et d'IA agentique. Nous abordons le problème des fuites d'API dans les ensembles de données de référence actuels de code-à-code en introduisant un nouvel ensemble de données construit à partir de Script Includes de ServiceNow en situation réelle, qui capturent le défi de l'intention d'utilisation d'API peu claire dans le code. Nos métriques d'évaluation montrent que cette méthode atteint une précision de récupération de 87,86 % dans le top 40, fournissant le contexte critique avec les API nécessaires pour une génération de code en aval réussie. Pour permettre des prédictions en temps réel, nous développons un pipeline complet de post-entraînement qui optimise un reranker compact de 0,6 milliard de paramètres grâce à la génération d'ensembles de données synthétiques, au réglage fin supervisé et à l'apprentissage par renforcement. Cette approche permet à notre reranker compact de surpasser un modèle beaucoup plus grand de 8 milliards de paramètres tout en maintenant une latence réduite de 2,5 fois, abordant efficacement les nuances du code spécifique à l'entreprise sans la surcharge computationnelle des modèles plus volumineux.
English
Current search techniques are limited to standard RAG query-document applications. In this paper, we propose a novel technique to expand the code and index for predicting the required APIs, directly enabling high-quality, end-to-end code generation for auto-completion and agentic AI applications. We address the problem of API leaks in current code-to-code benchmark datasets by introducing a new dataset built from real-world ServiceNow Script Includes that capture the challenge of unclear API usage intent in the code. Our evaluation metrics show that this method achieves 87.86% top-40 retrieval accuracy, allowing the critical context with APIs needed for successful downstream code generation. To enable real-time predictions, we develop a comprehensive post-training pipeline that optimizes a compact 0.6B reranker through synthetic dataset generation, supervised fine-tuning, and reinforcement learning. This approach enables our compact reranker to outperform a much larger 8B model while maintaining 2.5x reduced latency, effectively addressing the nuances of enterprise-specific code without the computational overhead of larger models.
PDF31October 1, 2025