Auteursrechtbescherming voor Grote Taalmodellen: Een Overzicht van Methoden, Uitdagingen en Trends
Copyright Protection for Large Language Models: A Survey of Methods, Challenges, and Trends
August 15, 2025
Auteurs: Zhenhua Xu, Xubin Yue, Zhebo Wang, Qichen Liu, Xixiang Zhao, Jingxuan Zhang, Wenjun Zeng, Wengpeng Xing, Dezhang Kong, Changting Lin, Meng Han
cs.AI
Samenvatting
Auteursrechtbescherming voor grote taalmodellen is van cruciaal belang, gezien de aanzienlijke ontwikkelingskosten, de eigendomsrechten en het potentieel voor misbruik. Bestaande overzichten hebben zich voornamelijk gericht op technieken voor het traceren van door LLM gegenereerde inhoud, namelijk tekstwatermerken, terwijl een systematische verkenning van methoden voor het beschermen van de modellen zelf (d.w.z. modelwatermerken en modelvingerafdrukken) ontbreekt. Bovendien zijn de relaties en verschillen tussen tekstwatermerken, modelwatermerken en modelvingerafdrukken nog niet uitgebreid verduidelijkt. Dit werk presenteert een uitgebreid overzicht van de huidige stand van zaken op het gebied van auteursrechtbeschermingstechnologieën voor LLM, met een focus op modelvingerafdrukken, en behandelt de volgende aspecten: (1) het verhelderen van het conceptuele verband van tekstwatermerken naar modelwatermerken en vingerafdrukken, en het hanteren van een uniforme terminologie die modelwatermerken opneemt in het bredere vingerafdrukkenkader; (2) het bieden van een overzicht en vergelijking van diverse tekstwatermerktechnieken, waarbij gevallen worden belicht waarin dergelijke methoden kunnen functioneren als modelvingerafdrukken; (3) het systematisch categoriseren en vergelijken van bestaande modelvingerafdrukbenaderingen voor LLM-auteursrechtbescherming; (4) het voor het eerst presenteren van technieken voor vingerafdrukoverdracht en vingerafdrukverwijdering; (5) het samenvatten van evaluatiemetrics voor modelvingerafdrukken, waaronder effectiviteit, onschadelijkheid, robuustheid, onopvallendheid en betrouwbaarheid; en (6) het bespreken van openstaande uitdagingen en toekomstige onderzoeksrichtingen. Dit overzicht beoogt onderzoekers een grondig inzicht te bieden in zowel tekstwatermerken als modelvingerafdruktechnologieën in het tijdperk van LLM, en zo verdere vooruitgang te bevorderen in het beschermen van hun intellectuele eigendom.
English
Copyright protection for large language models is of critical importance,
given their substantial development costs, proprietary value, and potential for
misuse. Existing surveys have predominantly focused on techniques for tracing
LLM-generated content-namely, text watermarking-while a systematic exploration
of methods for protecting the models themselves (i.e., model watermarking and
model fingerprinting) remains absent. Moreover, the relationships and
distinctions among text watermarking, model watermarking, and model
fingerprinting have not been comprehensively clarified. This work presents a
comprehensive survey of the current state of LLM copyright protection
technologies, with a focus on model fingerprinting, covering the following
aspects: (1) clarifying the conceptual connection from text watermarking to
model watermarking and fingerprinting, and adopting a unified terminology that
incorporates model watermarking into the broader fingerprinting framework; (2)
providing an overview and comparison of diverse text watermarking techniques,
highlighting cases where such methods can function as model fingerprinting; (3)
systematically categorizing and comparing existing model fingerprinting
approaches for LLM copyright protection; (4) presenting, for the first time,
techniques for fingerprint transfer and fingerprint removal; (5) summarizing
evaluation metrics for model fingerprints, including effectiveness,
harmlessness, robustness, stealthiness, and reliability; and (6) discussing
open challenges and future research directions. This survey aims to offer
researchers a thorough understanding of both text watermarking and model
fingerprinting technologies in the era of LLMs, thereby fostering further
advances in protecting their intellectual property.