LLM 시대의 저자 식별: 문제, 방법론, 그리고 도전과제
Authorship Attribution in the Era of LLMs: Problems, Methodologies, and Challenges
August 16, 2024
저자: Baixiang Huang, Canyu Chen, Kai Shu
cs.AI
초록
저자 신원의 정확한 귀속은 디지털 콘텐츠의 무결성을 유지하고 법의학적 조사를 개선하며 잘못된 정보와 표절의 위험을 완화하는 데 중요합니다. 적절한 저자 신원 귀속의 필수성에 대응하는 것은 신뢰성과 책임성을 유지하는 데 중요합니다. 대형 언어 모델(LLMs)의 급속한 발전으로 인간과 기계의 저자성 사이의 경계가 희미해져 전통적인 방법에 상당한 도전을 제기하고 있습니다. 우리는 LLM 시대의 저자 신원 귀속에 대한 최신 연구를 검토하는 포괄적인 문헌 고찰을 제시합니다. 이 조사는 네 가지 대표적인 문제를 범주화하여 이 분야의 풍경을 체계적으로 탐구합니다: (1) 인간 작성 텍스트 귀속; (2) LLM 생성 텍스트 감지; (3) LLM 생성 텍스트 귀속; 그리고 (4) 인간-LLM 공동 저자 텍스트 귀속. 또한 저자 신원 귀속 방법의 일반화와 설명 가능성을 보장하는 데 관련된 도전에 대해 논의합니다. 일반화는 다양한 도메인에 걸쳐 일반화할 수 있는 능력을 요구하며, 설명 가능성은 이러한 모델이 내린 결정에 대한 투명하고 이해하기 쉬운 통찰을 제공하는 것을 강조합니다. 기존 방법과 벤치마크의 장단점을 평가함으로써, 우리는 이 분야에서의 주요 개방 문제와 미래 연구 방향을 식별합니다. 이 문헌 고찰은 이 분야의 최신 동향을 이해하고자 하는 연구자와 실무자들을 위한 로드맵 역할을 합니다. 추가 자료 및 선별된 논문 목록은 https://llm-authorship.github.io에서 확인할 수 있으며 정기적으로 업데이트됩니다.
English
Accurate attribution of authorship is crucial for maintaining the integrity
of digital content, improving forensic investigations, and mitigating the risks
of misinformation and plagiarism. Addressing the imperative need for proper
authorship attribution is essential to uphold the credibility and
accountability of authentic authorship. The rapid advancements of Large
Language Models (LLMs) have blurred the lines between human and machine
authorship, posing significant challenges for traditional methods. We presents
a comprehensive literature review that examines the latest research on
authorship attribution in the era of LLMs. This survey systematically explores
the landscape of this field by categorizing four representative problems: (1)
Human-written Text Attribution; (2) LLM-generated Text Detection; (3)
LLM-generated Text Attribution; and (4) Human-LLM Co-authored Text Attribution.
We also discuss the challenges related to ensuring the generalization and
explainability of authorship attribution methods. Generalization requires the
ability to generalize across various domains, while explainability emphasizes
providing transparent and understandable insights into the decisions made by
these models. By evaluating the strengths and limitations of existing methods
and benchmarks, we identify key open problems and future research directions in
this field. This literature review serves a roadmap for researchers and
practitioners interested in understanding the state of the art in this rapidly
evolving field. Additional resources and a curated list of papers are available
and regularly updated at https://llm-authorship.github.io