Индекс ухудшения отладки: переосмысление стратегий отладки для языковых моделей программирования

Аннотация

Эффективность отладки ИИ следует предсказуемой модели экспоненциального затухания: большинство моделей теряют 60-80% своей способности к отладке уже через 2-3 попытки, несмотря на то, что итеративная отладка является критически важной функцией для практических систем генерации кода. Мы представляем Индекс Затухания Отладки (Debugging Decay Index, DDI) — математическую модель, которая количественно определяет момент, когда отладка становится неэффективной, и прогнозирует точки вмешательства. Наш стратегический подход "свежего старта" переключается с эксплуатации на исследование в ключевые моменты процесса отладки, демонстрируя, что своевременные вмешательства могут восстановить эффективность отладки. DDI выявляет фундаментальное ограничение в текущих подходах к отладке ИИ и предоставляет первую количественную модель для оптимизации итеративных стратегий генерации кода.

English

The effectiveness of AI debugging follows a predictable exponential decay pattern; most models lose 60-80% of their debugging capability within just 2-3 attempts, despite iterative debugging being a critical capability for practical code generation systems. We introduce the Debugging Decay Index (DDI), a mathematical framework that quantifies when debugging becomes ineffective and predicts intervention points. Our strategic fresh start approach shifts from exploitation to exploration at strategic points in the debugging process, demonstrating that well-timed interventions can rescue the effectiveness of debugging. DDI reveals a fundamental limitation in current AI debugging and provides the first quantitative framework for optimising iterative code generation strategies.

Индекс ухудшения отладки: переосмысление стратегий отладки для языковых моделей программирования

The Debugging Decay Index: Rethinking Debugging Strategies for Code LLMs

Аннотация

Support