Van Compromis naar Synergie: Een Veelzijdig Symbiotisch Watermerkingsraamwerk voor Grote Taalmodellen

Samenvatting

De opkomst van Large Language Models (LLM's) heeft zorgen doen toenemen over het misbruik van AI-gegenereerde tekst, waardoor watermerken een veelbelovende oplossing zijn geworden. Mainstream watermerkingsschema's voor LLM's vallen in twee categorieën: logits-gebaseerd en sampling-gebaseerd. Huidige schema's brengen echter compromissen met zich mee op het gebied van robuustheid, tekstkwaliteit en beveiliging. Om dit te verlichten, integreren we logits-gebaseerde en sampling-gebaseerde schema's, waarbij we hun respectieve sterke punten benutten om synergie te bereiken. In dit artikel stellen we een veelzijdig symbiotisch watermerkingsframework voor met drie strategieën: serieel, parallel en hybride. Het hybride framework past watermerken adaptief in met behulp van token-entropie en semantische entropie, waardoor de balans tussen detecteerbaarheid, robuustheid, tekstkwaliteit en beveiliging wordt geoptimaliseerd. Bovendien valideren we onze aanpak door middel van uitgebreide experimenten op verschillende datasets en modellen. Experimentele resultaten geven aan dat onze methode de bestaande baseline-methoden overtreft en state-of-the-art (SOTA) prestaties bereikt. Wij geloven dat dit framework nieuwe inzichten biedt in diverse watermerkingsparadigma's. Onze code is beschikbaar op https://github.com/redwyd/SymMark{https://github.com/redwyd/SymMark}.

English

The rise of Large Language Models (LLMs) has heightened concerns about the misuse of AI-generated text, making watermarking a promising solution. Mainstream watermarking schemes for LLMs fall into two categories: logits-based and sampling-based. However, current schemes entail trade-offs among robustness, text quality, and security. To mitigate this, we integrate logits-based and sampling-based schemes, harnessing their respective strengths to achieve synergy. In this paper, we propose a versatile symbiotic watermarking framework with three strategies: serial, parallel, and hybrid. The hybrid framework adaptively embeds watermarks using token entropy and semantic entropy, optimizing the balance between detectability, robustness, text quality, and security. Furthermore, we validate our approach through comprehensive experiments on various datasets and models. Experimental results indicate that our method outperforms existing baselines and achieves state-of-the-art (SOTA) performance. We believe this framework provides novel insights into diverse watermarking paradigms. Our code is available at https://github.com/redwyd/SymMark{https://github.com/redwyd/SymMark}.

Van Compromis naar Synergie: Een Veelzijdig Symbiotisch Watermerkingsraamwerk voor Grote Taalmodellen

From Trade-off to Synergy: A Versatile Symbiotic Watermarking Framework for Large Language Models

Samenvatting

Summary

Support

Support