ChatPaper.aiChatPaper

ReSyn: Een gegeneraliseerd recursief raamwerk voor synthese van reguliere expressies

ReSyn: A Generalized Recursive Regular Expression Synthesis Framework

June 13, 2026
Auteurs: Seongmin Kim, Hyunjoon Cheon, Su-Hyeon Kim, Yo-Sub Han, Sang-Ki Ko
cs.AI

Samenvatting

Bestaande Programming-By-Example (PBE)-systemen vertrouwen vaak op vereenvoudigde benchmarks die niet in staat zijn de hoge structurele complexiteit van echte regexen vast te leggen, zoals diepere nestingen en veelvuldig gebruik van unieoperaties. Om de hieruit resulterende prestatievermindering te overwinnen, stellen we ReSyn voor, een synthesizer-agnostisch verdeel-en-heersraamwerk dat complexe syntheseproblemen ontleedt in beheersbare deelproblemen. We introduceren ook Set2Regex, een parameter-efficiënte synthesizer die de permutatie-invariantie van voorbeelden vastlegt. Experimentele resultaten tonen aan dat ReSyn de nauwkeurigheid van verschillende synthesizers aanzienlijk verbetert, en de combinatie met Set2Regex levert een nieuwe state-of-the-art op uitdagende echte benchmarks. De volledige broncode, datasets en voorgetrainde modelcontrolepunten zijn openbaar beschikbaar op https://github.com/mrseongminkim/ReSyn.
English
Existing Programming-By-Example (PBE) systems often rely on simplified benchmarks that fail to capture the high structural complexity of real-world regexes, such as deeper nesting and frequent use of union operations. To overcome the resulting performance drop, we propose ReSyn, a synthesizer-agnostic divide-and-conquer framework that decomposes complex synthesis problem into manageable sub-problems. We also introduce Set2Regex, a parameter-efficient synthesizer capturing the permutation invariance of examples. Experimental results demonstrate that ReSyn significantly boosts accuracy across various synthesizers, and its combination with Set2Regex establishes a new state-of-the-art on challenging real-world benchmark. The complete source code, datasets, and pre-trained model checkpoints are publicly available at https://github.com/mrseongminkim/ReSyn.