ChatPaper.aiChatPaper

Tracciando un Decennio di Linguistica Computazionale in Italia: Il Corpus CLiC-it

Charting a Decade of Computational Linguistics in Italy: The CLiC-it Corpus

September 23, 2025
Autori: Chiara Alzetta, Serena Auriemma, Alessandro Bondielli, Luca Dini, Chiara Fazzone, Alessio Miaschi, Martina Miliani, Marta Sartor
cs.AI

Abstract

Nel corso dell'ultimo decennio, la Linguistica Computazionale (CL) e l'Elaborazione del Linguaggio Naturale (NLP) hanno subito una rapida evoluzione, in particolare con l'avvento dei Modelli Linguistici di Grande Dimensione (LLM) basati su Transformer. Questo cambiamento ha trasformato gli obiettivi e le priorità della ricerca, passando dalle Risorse Lessicali e Semantiche alla Modellazione del Linguaggio e alla Multimodalità. In questo studio, tracciamo le tendenze di ricerca della comunità italiana di CL e NLP attraverso un'analisi dei contributi presentati a CLiC-it, considerata la principale conferenza italiana nel settore. Abbiamo raccolto gli atti delle prime 10 edizioni della conferenza CLiC-it (dal 2014 al 2024) nel CLiC-it Corpus, fornendo un'analisi completa sia dei metadati, inclusa la provenienza degli autori, il genere, le affiliazioni e altro, sia del contenuto degli articoli stessi, che affrontano vari argomenti. Il nostro obiettivo è fornire alle comunità di ricerca italiane e internazionali preziose intuizioni sulle tendenze emergenti e sugli sviluppi chiave nel tempo, supportando decisioni informate e direzioni future nel campo.
English
Over the past decade, Computational Linguistics (CL) and Natural Language Processing (NLP) have evolved rapidly, especially with the advent of Transformer-based Large Language Models (LLMs). This shift has transformed research goals and priorities, from Lexical and Semantic Resources to Language Modelling and Multimodality. In this study, we track the research trends of the Italian CL and NLP community through an analysis of the contributions to CLiC-it, arguably the leading Italian conference in the field. We compile the proceedings from the first 10 editions of the CLiC-it conference (from 2014 to 2024) into the CLiC-it Corpus, providing a comprehensive analysis of both its metadata, including author provenance, gender, affiliations, and more, as well as the content of the papers themselves, which address various topics. Our goal is to provide the Italian and international research communities with valuable insights into emerging trends and key developments over time, supporting informed decisions and future directions in the field.
PDF01September 30, 2025