Tracciando un Decennio di Linguistica Computazionale in Italia: Il Corpus CLiC-it
Charting a Decade of Computational Linguistics in Italy: The CLiC-it Corpus
September 23, 2025
Autori: Chiara Alzetta, Serena Auriemma, Alessandro Bondielli, Luca Dini, Chiara Fazzone, Alessio Miaschi, Martina Miliani, Marta Sartor
cs.AI
Abstract
Nel corso dell'ultimo decennio, la Linguistica Computazionale (CL) e l'Elaborazione del Linguaggio Naturale (NLP) hanno subito una rapida evoluzione, in particolare con l'avvento dei Modelli Linguistici di Grande Dimensione (LLM) basati su Transformer. Questo cambiamento ha trasformato gli obiettivi e le priorità della ricerca, passando dalle Risorse Lessicali e Semantiche alla Modellazione del Linguaggio e alla Multimodalità. In questo studio, tracciamo le tendenze di ricerca della comunità italiana di CL e NLP attraverso un'analisi dei contributi presentati a CLiC-it, considerata la principale conferenza italiana nel settore. Abbiamo raccolto gli atti delle prime 10 edizioni della conferenza CLiC-it (dal 2014 al 2024) nel CLiC-it Corpus, fornendo un'analisi completa sia dei metadati, inclusa la provenienza degli autori, il genere, le affiliazioni e altro, sia del contenuto degli articoli stessi, che affrontano vari argomenti. Il nostro obiettivo è fornire alle comunità di ricerca italiane e internazionali preziose intuizioni sulle tendenze emergenti e sugli sviluppi chiave nel tempo, supportando decisioni informate e direzioni future nel campo.
English
Over the past decade, Computational Linguistics (CL) and Natural Language
Processing (NLP) have evolved rapidly, especially with the advent of
Transformer-based Large Language Models (LLMs). This shift has transformed
research goals and priorities, from Lexical and Semantic Resources to Language
Modelling and Multimodality. In this study, we track the research trends of the
Italian CL and NLP community through an analysis of the contributions to
CLiC-it, arguably the leading Italian conference in the field. We compile the
proceedings from the first 10 editions of the CLiC-it conference (from 2014 to
2024) into the CLiC-it Corpus, providing a comprehensive analysis of both its
metadata, including author provenance, gender, affiliations, and more, as well
as the content of the papers themselves, which address various topics. Our goal
is to provide the Italian and international research communities with valuable
insights into emerging trends and key developments over time, supporting
informed decisions and future directions in the field.