ChatPaper.aiChatPaper

SLIMER-IT: Нулевое обучение с учителем для распознавания именованных сущностей на итальянском языке

SLIMER-IT: Zero-Shot NER on Italian Language

September 24, 2024
Авторы: Andrew Zamai, Leonardo Rigutini, Marco Maggini, Andrea Zugarini
cs.AI

Аннотация

Традиционные подходы к распознаванию именованных сущностей (NER) формулируют задачу как проблему разметки последовательности BIO. Хотя эти системы часто проявляют себя отлично в конечной задаче, они требуют обширных размеченных данных и испытывают затруднения с обобщением на входные области вне распределения и невидимые типы сущностей. В отличие от этого, большие языковые модели (LLM) продемонстрировали сильные возможности нулевого обучения. Хотя несколько работ затрагивают нулевое обучение NER на английском языке, мало что было сделано на других языках. В данной статье мы определяем критерии оценки для нулевого обучения NER, применяя их к итальянскому языку. Кроме того, мы представляем SLIMER-IT, итальянскую версию SLIMER, подход к настройке инструкций для нулевого обучения NER, используя запросы, обогащенные определениями и руководствами. Сравнения с другими современными моделями демонстрируют превосходство SLIMER-IT на никогда ранее не встречавшихся тегах сущностей.
English
Traditional approaches to Named Entity Recognition (NER) frame the task into a BIO sequence labeling problem. Although these systems often excel in the downstream task at hand, they require extensive annotated data and struggle to generalize to out-of-distribution input domains and unseen entity types. On the contrary, Large Language Models (LLMs) have demonstrated strong zero-shot capabilities. While several works address Zero-Shot NER in English, little has been done in other languages. In this paper, we define an evaluation framework for Zero-Shot NER, applying it to the Italian language. Furthermore, we introduce SLIMER-IT, the Italian version of SLIMER, an instruction-tuning approach for zero-shot NER leveraging prompts enriched with definition and guidelines. Comparisons with other state-of-the-art models, demonstrate the superiority of SLIMER-IT on never-seen-before entity tags.

Summary

AI-Generated Summary

PDF52November 16, 2024