Автоматическое обнаружение текстов, созданных генеративным ИИ: сравнительный анализ нейросетевых моделей

Аннотация

Быстрое распространение крупных языковых моделей значительно усложнило различение текстов, написанных человеком и сгенерированных искусственным интеллектом, что породило серьезные проблемы в академической, редакторской и социальной сферах. В данной статье исследуется проблема обнаружения текстов, созданных ИИ, путем проектирования, реализации и сравнительного анализа нескольких детекторов на основе машинного обучения. Разработаны и проанализированы четыре нейросетевые архитектуры: многослойный перцептрон, одномерная сверточная нейронная сеть, CNN на основе MobileNet и модель трансформера. Предложенные модели сравниваются с широко используемыми онлайн-детекторами, включая ZeroGPT, GPTZero, QuillBot, Originality.AI, Sapling, IsGen, Rephrase и Writer. Эксперименты проводятся на мультиязычном наборе данных COLING в английской и итальянской конфигурациях, а также на оригинальном тематическом наборе данных, сфокусированном на теме искусства и психического здоровья. Результаты показывают, что обученные с учителем детекторы демонстрируют более стабильную и надежную работу по сравнению с коммерческими инструментами в различных языках и доменах, выявляя ключевые преимущества и ограничения современных стратегий обнаружения.

English

The rapid proliferation of Large Language Models has significantly increased the difficulty of distinguishing between human-written and AI generated texts, raising critical issues across academic, editorial, and social domains. This paper investigates the problem of AI generated text detection through the design, implementation, and comparative evaluation of multiple machine learning based detectors. Four neural architectures are developed and analyzed: a Multilayer Perceptron, a one-dimensional Convolutional Neural Network, a MobileNet-based CNN, and a Transformer model. The proposed models are benchmarked against widely used online detectors, including ZeroGPT, GPTZero, QuillBot, Originality.AI, Sapling, IsGen, Rephrase, and Writer. Experiments are conducted on the COLING Multilingual Dataset, considering both English and Italian configurations, as well as on an original thematic dataset focused on Art and Mental Health. Results show that supervised detectors achieve more stable and robust performance than commercial tools across different languages and domains, highlighting key strengths and limitations of current detection strategies.

Автоматическое обнаружение текстов, созданных генеративным ИИ: сравнительный анализ нейросетевых моделей

Automatic detection of Gen-AI texts: A comparative framework of neural models

Аннотация

Support