OpenCodeInterpreter: Интеграция генерации кода с выполнением и уточнениемOpenCodeInterpreter: Integrating Code Generation with Execution and
Refinement
Внедрение крупных языковых моделей значительно продвинуло генерацию кода. Однако открытые модели часто уступают в возможностях выполнения и итеративного уточнения кода по сравнению с продвинутыми системами, такими как GPT-4 Code Interpreter. Для решения этой проблемы мы представляем OpenCodeInterpreter — семейство открытых систем для генерации, выполнения и итеративного уточнения кода. Поддерживаемый набором данных Code-Feedback, содержащим 68 тысяч многоходовых взаимодействий, OpenCodeInterpreter интегрирует выполнение кода и обратную связь от человека для динамического уточнения кода. Наше всестороннее тестирование OpenCodeInterpreter на ключевых бенчмарках, таких как HumanEval, MBPP и их улучшенных версиях из EvalPlus, демонстрирует его выдающуюся производительность. В частности, OpenCodeInterpreter-33B достигает точности 83,2 (76,4) на средних (и улучшенных) версиях HumanEval и MBPP, что близко к результату GPT-4 — 84,2 (76,2), а с синтезированной обратной связью от GPT-4 этот показатель повышается до 91,6 (84,6). OpenCodeInterpreter сокращает разрыв между открытыми моделями генерации кода и проприетарными системами, такими как GPT-4 Code Interpreter.