ChatPaper.aiChatPaper

SLIMER-IT: Riconoscimento delle Entità Nominative senza Bisogno di Addestramento sulla Lingua Italiana

SLIMER-IT: Zero-Shot NER on Italian Language

September 24, 2024
Autori: Andrew Zamai, Leonardo Rigutini, Marco Maggini, Andrea Zugarini
cs.AI

Abstract

Gli approcci tradizionali al Riconoscimento delle Entità Nominative (NER) inquadrano il compito in un problema di etichettatura sequenziale BIO. Sebbene questi sistemi eccellano spesso nel compito successivo, richiedono dati annotati estensivi e faticano a generalizzare a domini di input al di fuori della distribuzione e a tipi di entità non visti in precedenza. Al contrario, i Grandi Modelli Linguistici (LLM) hanno dimostrato forti capacità di zero-shot. Mentre diversi lavori affrontano il NER Zero-Shot in inglese, poco è stato fatto in altre lingue. In questo articolo, definiamo un framework di valutazione per il NER Zero-Shot, applicandolo alla lingua italiana. Inoltre, presentiamo SLIMER-IT, la versione italiana di SLIMER, un approccio di addestramento istruzionale per il NER zero-shot che sfrutta prompt arricchiti con definizioni e linee guida. Confronti con altri modelli all'avanguardia dimostrano la superiorità di SLIMER-IT su etichette di entità mai viste prima.
English
Traditional approaches to Named Entity Recognition (NER) frame the task into a BIO sequence labeling problem. Although these systems often excel in the downstream task at hand, they require extensive annotated data and struggle to generalize to out-of-distribution input domains and unseen entity types. On the contrary, Large Language Models (LLMs) have demonstrated strong zero-shot capabilities. While several works address Zero-Shot NER in English, little has been done in other languages. In this paper, we define an evaluation framework for Zero-Shot NER, applying it to the Italian language. Furthermore, we introduce SLIMER-IT, the Italian version of SLIMER, an instruction-tuning approach for zero-shot NER leveraging prompts enriched with definition and guidelines. Comparisons with other state-of-the-art models, demonstrate the superiority of SLIMER-IT on never-seen-before entity tags.

Summary

AI-Generated Summary

PDF52November 16, 2024