Les modèles de langage open source surpassent les travailleurs humains et se rapprochent de ChatGPT dans les tâches d'annotation de texte.

papers.abstract

Cette étude examine les performances des modèles de langage de grande taille (LLM) open source dans les tâches d'annotation de texte et les compare avec des modèles propriétaires comme ChatGPT et des services basés sur l'humain tels que MTurk. Alors que des recherches antérieures ont démontré les performances élevées de ChatGPT dans de nombreuses tâches de traitement du langage naturel (NLP), les LLM open source comme HugginChat et FLAN attirent l'attention pour leur rentabilité, transparence, reproductibilité et protection supérieure des données. Nous évaluons ces modèles en utilisant à la fois des approches zero-shot et few-shot, ainsi que différents paramètres de température, sur une variété de tâches d'annotation de texte. Nos résultats montrent que si ChatGPT obtient les meilleures performances dans la plupart des tâches, les LLM open source surpassent non seulement MTurk, mais démontrent également un potentiel compétitif face à ChatGPT dans des tâches spécifiques.

English

This study examines the performance of open-source Large Language Models (LLMs) in text annotation tasks and compares it with proprietary models like ChatGPT and human-based services such as MTurk. While prior research demonstrated the high performance of ChatGPT across numerous NLP tasks, open-source LLMs like HugginChat and FLAN are gaining attention for their cost-effectiveness, transparency, reproducibility, and superior data protection. We assess these models using both zero-shot and few-shot approaches and different temperature parameters across a range of text annotation tasks. Our findings show that while ChatGPT achieves the best performance in most tasks, open-source LLMs not only outperform MTurk but also demonstrate competitive potential against ChatGPT in specific tasks.

Les modèles de langage open source surpassent les travailleurs humains et se rapprochent de ChatGPT dans les tâches d'annotation de texte.

Open-Source Large Language Models Outperform Crowd Workers and Approach ChatGPT in Text-Annotation Tasks

papers.abstract

Support