OpenCodeInterpreter: Integración de la Generación de Código con Ejecución y RefinamientoOpenCodeInterpreter: Integrating Code Generation with Execution and
Refinement
La introducción de los modelos de lenguaje de gran escala ha avanzado significativamente la generación de código. Sin embargo, los modelos de código abierto a menudo carecen de las capacidades de ejecución y refinamiento iterativo de sistemas avanzados como el GPT-4 Code Interpreter. Para abordar esto, presentamos OpenCodeInterpreter, una familia de sistemas de código abierto diseñados para generar, ejecutar y refinar código de manera iterativa. Respaldado por Code-Feedback, un conjunto de datos que incluye 68K interacciones multiturno, OpenCodeInterpreter integra la ejecución y la retroalimentación humana para el refinamiento dinámico del código. Nuestra evaluación exhaustiva de OpenCodeInterpreter en puntos de referencia clave como HumanEval, MBPP y sus versiones mejoradas de EvalPlus revela un rendimiento excepcional. En particular, OpenCodeInterpreter-33B logra una precisión de 83.2 (76.4) en el promedio (y versiones plus) de HumanEval y MBPP, rivalizando estrechamente con el 84.2 (76.2) de GPT-4, y se eleva aún más a 91.6 (84.6) con retroalimentación humana sintetizada de GPT-4. OpenCodeInterpreter reduce la brecha entre los modelos de generación de código de código abierto y los sistemas propietarios como GPT-4 Code Interpreter.