ChatPaper.aiChatPaper

Auteurschapstoewijzing in het tijdperk van LLM's: Problemen, Methodologieën en Uitdagingen

Authorship Attribution in the Era of LLMs: Problems, Methodologies, and Challenges

August 16, 2024
Auteurs: Baixiang Huang, Canyu Chen, Kai Shu
cs.AI

Samenvatting

Nauwkeurige toeschrijving van auteurschap is cruciaal voor het behoud van de integriteit van digitale content, het verbeteren van forensisch onderzoek en het beperken van de risico's van desinformatie en plagiaat. Het aanpakken van de dringende behoefte aan correcte auteurschapstoeschrijving is essentieel om de geloofwaardigheid en verantwoordelijkheid van authentiek auteurschap te waarborgen. De snelle vooruitgang van Large Language Models (LLM's) heeft de grenzen tussen menselijk en machinaal auteurschap vervaagd, wat aanzienlijke uitdagingen oplevert voor traditionele methoden. Wij presenteren een uitgebreid literatuuronderzoek dat de nieuwste onderzoeken op het gebied van auteurschapstoeschrijving in het tijdperk van LLM's onderzoekt. Deze survey verkent systematisch het landschap van dit vakgebied door vier representatieve problemen te categoriseren: (1) Toeschrijving van door mensen geschreven tekst; (2) Detectie van door LLM's gegenereerde tekst; (3) Toeschrijving van door LLM's gegenereerde tekst; en (4) Toeschrijving van door mens en LLM samen geschreven tekst. We bespreken ook de uitdagingen die samenhangen met het waarborgen van de generalisatie en uitlegbaarheid van methoden voor auteurschapstoeschrijving. Generalisatie vereist het vermogen om over verschillende domeinen heen te generaliseren, terwijl uitlegbaarheid het bieden van transparante en begrijpelijke inzichten in de beslissingen van deze modellen benadrukt. Door de sterke en zwakke punten van bestaande methoden en benchmarks te evalueren, identificeren we belangrijke open problemen en toekomstige onderzoeksrichtingen in dit vakgebied. Dit literatuuronderzoek dient als een routekaart voor onderzoekers en praktijkmensen die geïnteresseerd zijn in het begrijpen van de stand van de techniek in dit snel evoluerende veld. Aanvullende bronnen en een gecureerde lijst van papers zijn beschikbaar en worden regelmatig bijgewerkt op https://llm-authorship.github.io.
English
Accurate attribution of authorship is crucial for maintaining the integrity of digital content, improving forensic investigations, and mitigating the risks of misinformation and plagiarism. Addressing the imperative need for proper authorship attribution is essential to uphold the credibility and accountability of authentic authorship. The rapid advancements of Large Language Models (LLMs) have blurred the lines between human and machine authorship, posing significant challenges for traditional methods. We presents a comprehensive literature review that examines the latest research on authorship attribution in the era of LLMs. This survey systematically explores the landscape of this field by categorizing four representative problems: (1) Human-written Text Attribution; (2) LLM-generated Text Detection; (3) LLM-generated Text Attribution; and (4) Human-LLM Co-authored Text Attribution. We also discuss the challenges related to ensuring the generalization and explainability of authorship attribution methods. Generalization requires the ability to generalize across various domains, while explainability emphasizes providing transparent and understandable insights into the decisions made by these models. By evaluating the strengths and limitations of existing methods and benchmarks, we identify key open problems and future research directions in this field. This literature review serves a roadmap for researchers and practitioners interested in understanding the state of the art in this rapidly evolving field. Additional resources and a curated list of papers are available and regularly updated at https://llm-authorship.github.io

Summary

AI-Generated Summary

PDF122November 19, 2024