SLIMER-IT : Reconnaissance d'entités nommées sans apprentissage préalable en langue italienne
SLIMER-IT: Zero-Shot NER on Italian Language
September 24, 2024
Auteurs: Andrew Zamai, Leonardo Rigutini, Marco Maggini, Andrea Zugarini
cs.AI
Résumé
Les approches traditionnelles de la Reconnaissance d'Entités Nommées (NER) encadrent la tâche dans un problème d'étiquetage de séquence BIO. Bien que ces systèmes excellent souvent dans la tâche en aval, ils nécessitent des données annotées étendues et ont du mal à généraliser à des domaines d'entrée hors distribution et à des types d'entités non vus. Au contraire, les Grands Modèles de Langage (LLMs) ont démontré de fortes capacités de zéro-shot. Alors que plusieurs travaux abordent le NER Zéro-Shot en anglais, peu ont été réalisés dans d'autres langues. Dans cet article, nous définissons un cadre d'évaluation pour le NER Zéro-Shot, en l'appliquant à la langue italienne. De plus, nous introduisons SLIMER-IT, la version italienne de SLIMER, une approche d'accord d'instructions pour le NER zéro-shot exploitant des invites enrichies de définitions et de directives. Des comparaisons avec d'autres modèles de pointe démontrent la supériorité de SLIMER-IT sur des balises d'entités jamais vues auparavant.
English
Traditional approaches to Named Entity Recognition (NER) frame the task into
a BIO sequence labeling problem. Although these systems often excel in the
downstream task at hand, they require extensive annotated data and struggle to
generalize to out-of-distribution input domains and unseen entity types. On the
contrary, Large Language Models (LLMs) have demonstrated strong zero-shot
capabilities. While several works address Zero-Shot NER in English, little has
been done in other languages. In this paper, we define an evaluation framework
for Zero-Shot NER, applying it to the Italian language. Furthermore, we
introduce SLIMER-IT, the Italian version of SLIMER, an instruction-tuning
approach for zero-shot NER leveraging prompts enriched with definition and
guidelines. Comparisons with other state-of-the-art models, demonstrate the
superiority of SLIMER-IT on never-seen-before entity tags.Summary
AI-Generated Summary