ChatPaper.aiChatPaper

Atribuição de autoria na era dos LLMs: Problemas, Metodologias e Desafios

Authorship Attribution in the Era of LLMs: Problems, Methodologies, and Challenges

August 16, 2024
Autores: Baixiang Huang, Canyu Chen, Kai Shu
cs.AI

Resumo

A atribuição precisa de autoria é crucial para manter a integridade do conteúdo digital, melhorar investigações forenses e mitigar os riscos de desinformação e plágio. Abordar a necessidade imperativa de uma adequada atribuição de autoria é essencial para manter a credibilidade e responsabilidade da autoria autêntica. Os avanços rápidos dos Modelos de Linguagem de Grande Escala (LLMs) têm borrado as fronteiras entre autoria humana e de máquina, apresentando desafios significativos para os métodos tradicionais. Apresentamos uma revisão abrangente da literatura que examina as pesquisas mais recentes sobre atribuição de autoria na era dos LLMs. Esta pesquisa explora sistematicamente o panorama deste campo, categorizando quatro problemas representativos: (1) Atribuição de Texto Escrito por Humanos; (2) Detecção de Texto Gerado por LLMs; (3) Atribuição de Texto Gerado por LLMs; e (4) Atribuição de Texto Coescrito por Humanos e LLMs. Também discutimos os desafios relacionados à garantia da generalização e explicabilidade dos métodos de atribuição de autoria. A generalização requer a capacidade de generalizar em vários domínios, enquanto a explicabilidade enfatiza fornecer insights transparentes e compreensíveis sobre as decisões tomadas por esses modelos. Ao avaliar os pontos fortes e limitações dos métodos e referências existentes, identificamos problemas abertos-chave e direções para futuras pesquisas neste campo. Esta revisão de literatura serve como um guia para pesquisadores e profissionais interessados em compreender o estado da arte neste campo em rápida evolução. Recursos adicionais e uma lista selecionada de artigos estão disponíveis e regularmente atualizados em https://llm-authorship.github.io.
English
Accurate attribution of authorship is crucial for maintaining the integrity of digital content, improving forensic investigations, and mitigating the risks of misinformation and plagiarism. Addressing the imperative need for proper authorship attribution is essential to uphold the credibility and accountability of authentic authorship. The rapid advancements of Large Language Models (LLMs) have blurred the lines between human and machine authorship, posing significant challenges for traditional methods. We presents a comprehensive literature review that examines the latest research on authorship attribution in the era of LLMs. This survey systematically explores the landscape of this field by categorizing four representative problems: (1) Human-written Text Attribution; (2) LLM-generated Text Detection; (3) LLM-generated Text Attribution; and (4) Human-LLM Co-authored Text Attribution. We also discuss the challenges related to ensuring the generalization and explainability of authorship attribution methods. Generalization requires the ability to generalize across various domains, while explainability emphasizes providing transparent and understandable insights into the decisions made by these models. By evaluating the strengths and limitations of existing methods and benchmarks, we identify key open problems and future research directions in this field. This literature review serves a roadmap for researchers and practitioners interested in understanding the state of the art in this rapidly evolving field. Additional resources and a curated list of papers are available and regularly updated at https://llm-authorship.github.io

Summary

AI-Generated Summary

PDF122November 19, 2024