SLIMER-IT: Нулевое обучение с учителем для распознавания именованных сущностей на итальянском языке
SLIMER-IT: Zero-Shot NER on Italian Language
September 24, 2024
Авторы: Andrew Zamai, Leonardo Rigutini, Marco Maggini, Andrea Zugarini
cs.AI
Аннотация
Традиционные подходы к распознаванию именованных сущностей (NER) формулируют задачу как проблему разметки последовательности BIO. Хотя эти системы часто проявляют себя отлично в конечной задаче, они требуют обширных размеченных данных и испытывают затруднения с обобщением на входные области вне распределения и невидимые типы сущностей. В отличие от этого, большие языковые модели (LLM) продемонстрировали сильные возможности нулевого обучения. Хотя несколько работ затрагивают нулевое обучение NER на английском языке, мало что было сделано на других языках. В данной статье мы определяем критерии оценки для нулевого обучения NER, применяя их к итальянскому языку. Кроме того, мы представляем SLIMER-IT, итальянскую версию SLIMER, подход к настройке инструкций для нулевого обучения NER, используя запросы, обогащенные определениями и руководствами. Сравнения с другими современными моделями демонстрируют превосходство SLIMER-IT на никогда ранее не встречавшихся тегах сущностей.
English
Traditional approaches to Named Entity Recognition (NER) frame the task into
a BIO sequence labeling problem. Although these systems often excel in the
downstream task at hand, they require extensive annotated data and struggle to
generalize to out-of-distribution input domains and unseen entity types. On the
contrary, Large Language Models (LLMs) have demonstrated strong zero-shot
capabilities. While several works address Zero-Shot NER in English, little has
been done in other languages. In this paper, we define an evaluation framework
for Zero-Shot NER, applying it to the Italian language. Furthermore, we
introduce SLIMER-IT, the Italian version of SLIMER, an instruction-tuning
approach for zero-shot NER leveraging prompts enriched with definition and
guidelines. Comparisons with other state-of-the-art models, demonstrate the
superiority of SLIMER-IT on never-seen-before entity tags.Summary
AI-Generated Summary