ChatPaper.aiChatPaper

ReSyn: Обобщенный фреймворк рекурсивного синтеза регулярных выражений

ReSyn: A Generalized Recursive Regular Expression Synthesis Framework

June 13, 2026
Авторы: Seongmin Kim, Hyunjoon Cheon, Su-Hyeon Kim, Yo-Sub Han, Sang-Ki Ko
cs.AI

Аннотация

Существующие системы программирования по примерам (PBE) часто полагаются на упрощённые эталоны, которые не отражают высокую структурную сложность реальных регулярных выражений, такую как более глубокая вложенность и частое использование операций объединения. Для преодоления связанного с этим снижения производительности мы предлагаем ReSyn — не зависящую от конкретного синтезатора структуру «разделяй и властвуй», которая разбивает сложную задачу синтеза на управляемые подзадачи. Мы также представляем Set2Regex — эффективный по числу параметров синтезатор, учитывающий инвариантность примеров к перестановкам. Результаты экспериментов показывают, что ReSyn значительно повышает точность различных синтезаторов, а его комбинация с Set2Regex устанавливает новый современный уровень на сложном реальном эталоне. Полный исходный код, наборы данных и предобученные контрольные точки моделей доступны по адресу https://github.com/mrseongminkim/ReSyn.
English
Existing Programming-By-Example (PBE) systems often rely on simplified benchmarks that fail to capture the high structural complexity of real-world regexes, such as deeper nesting and frequent use of union operations. To overcome the resulting performance drop, we propose ReSyn, a synthesizer-agnostic divide-and-conquer framework that decomposes complex synthesis problem into manageable sub-problems. We also introduce Set2Regex, a parameter-efficient synthesizer capturing the permutation invariance of examples. Experimental results demonstrate that ReSyn significantly boosts accuracy across various synthesizers, and its combination with Set2Regex establishes a new state-of-the-art on challenging real-world benchmark. The complete source code, datasets, and pre-trained model checkpoints are publicly available at https://github.com/mrseongminkim/ReSyn.