ChatPaper.aiChatPaper

LLM時代の著者帰属:問題、方法論、そして課題

Authorship Attribution in the Era of LLMs: Problems, Methodologies, and Challenges

August 16, 2024
著者: Baixiang Huang, Canyu Chen, Kai Shu
cs.AI

要旨

デジタルコンテンツの信頼性を維持し、フォレンジック調査を改善し、誤情報や盗作のリスクを軽減するためには、正確な著者帰属が極めて重要です。適切な著者帰属の必要性に対処することは、真正な著者の信頼性と責任を維持するために不可欠です。大規模言語モデル(LLM)の急速な進歩により、人間と機械による著者性の境界線が曖昧になり、従来の手法に大きな課題を突きつけています。本論文では、LLM時代における著者帰属に関する最新研究を検証する包括的な文献レビューを提示します。この調査では、代表的な4つの問題を分類することで、この分野の現状を体系的に探求します:(1)人間が書いたテキストの帰属、(2)LLM生成テキストの検出、(3)LLM生成テキストの帰属、(4)人間とLLMの共著テキストの帰属です。また、著者帰属手法の汎用性と説明可能性を確保する上での課題についても議論します。汎用性はさまざまなドメインにわたって一般化する能力を必要とし、説明可能性はこれらのモデルが下す決定に対する透明で理解可能な洞察を提供することを重視します。既存の手法とベンチマークの強みと限界を評価することで、この分野における重要な未解決問題と今後の研究方向性を特定します。この文献レビューは、この急速に進化する分野の最先端を理解したい研究者や実務者にとってのロードマップとして機能します。追加リソースと精選された論文リストは、https://llm-authorship.github.io で定期的に更新されています。
English
Accurate attribution of authorship is crucial for maintaining the integrity of digital content, improving forensic investigations, and mitigating the risks of misinformation and plagiarism. Addressing the imperative need for proper authorship attribution is essential to uphold the credibility and accountability of authentic authorship. The rapid advancements of Large Language Models (LLMs) have blurred the lines between human and machine authorship, posing significant challenges for traditional methods. We presents a comprehensive literature review that examines the latest research on authorship attribution in the era of LLMs. This survey systematically explores the landscape of this field by categorizing four representative problems: (1) Human-written Text Attribution; (2) LLM-generated Text Detection; (3) LLM-generated Text Attribution; and (4) Human-LLM Co-authored Text Attribution. We also discuss the challenges related to ensuring the generalization and explainability of authorship attribution methods. Generalization requires the ability to generalize across various domains, while explainability emphasizes providing transparent and understandable insights into the decisions made by these models. By evaluating the strengths and limitations of existing methods and benchmarks, we identify key open problems and future research directions in this field. This literature review serves a roadmap for researchers and practitioners interested in understanding the state of the art in this rapidly evolving field. Additional resources and a curated list of papers are available and regularly updated at https://llm-authorship.github.io

Summary

AI-Generated Summary

PDF122November 19, 2024