DeepCodeSeek: Recuperación de API en Tiempo Real para la Generación de Código Consciente del Contexto
DeepCodeSeek: Real-Time API Retrieval for Context-Aware Code Generation
September 30, 2025
Autores: Esakkivel Esakkiraja, Denis Akhiyarov, Aditya Shanmugham, Chitra Ganapathy
cs.AI
Resumen
Las técnicas de búsqueda actuales se limitan a aplicaciones estándar de consulta-documento RAG. En este artículo, proponemos una técnica novedosa para expandir el código y el índice con el fin de predecir las API requeridas, permitiendo directamente una generación de código de alta calidad de extremo a extremo para aplicaciones de autocompletado e IA agentiva. Abordamos el problema de las fugas de API en los conjuntos de datos de referencia actuales de código a código mediante la introducción de un nuevo conjunto de datos construido a partir de Script Includes de ServiceNow del mundo real, que capturan el desafío de la intención poco clara del uso de API en el código. Nuestras métricas de evaluación muestran que este método alcanza un 87,86% de precisión en la recuperación de los 40 principales, proporcionando el contexto crítico con las API necesarias para una generación de código descendente exitosa. Para habilitar predicciones en tiempo real, desarrollamos una canalización integral de posentrenamiento que optimiza un reranker compacto de 0.600 millones de parámetros mediante la generación de conjuntos de datos sintéticos, ajuste fino supervisado y aprendizaje por refuerzo. Este enfoque permite que nuestro reranker compacto supere a un modelo mucho más grande de 8.000 millones de parámetros, manteniendo una latencia reducida en 2,5 veces, abordando efectivamente los matices del código específico de la empresa sin la sobrecarga computacional de modelos más grandes.
English
Current search techniques are limited to standard RAG query-document
applications. In this paper, we propose a novel technique to expand the code
and index for predicting the required APIs, directly enabling high-quality,
end-to-end code generation for auto-completion and agentic AI applications. We
address the problem of API leaks in current code-to-code benchmark datasets by
introducing a new dataset built from real-world ServiceNow Script Includes that
capture the challenge of unclear API usage intent in the code. Our evaluation
metrics show that this method achieves 87.86% top-40 retrieval accuracy,
allowing the critical context with APIs needed for successful downstream code
generation. To enable real-time predictions, we develop a comprehensive
post-training pipeline that optimizes a compact 0.6B reranker through synthetic
dataset generation, supervised fine-tuning, and reinforcement learning. This
approach enables our compact reranker to outperform a much larger 8B model
while maintaining 2.5x reduced latency, effectively addressing the nuances of
enterprise-specific code without the computational overhead of larger models.