ChatPaper.aiChatPaper

Cartographie d'une décennie de linguistique computationnelle en Italie : Le corpus CLiC-it

Charting a Decade of Computational Linguistics in Italy: The CLiC-it Corpus

September 23, 2025
papers.authors: Chiara Alzetta, Serena Auriemma, Alessandro Bondielli, Luca Dini, Chiara Fazzone, Alessio Miaschi, Martina Miliani, Marta Sartor
cs.AI

papers.abstract

Au cours de la dernière décennie, la Linguistique Informatique (LI) et le Traitement Automatique des Langues (TAL) ont évolué rapidement, notamment avec l’émergence des modèles de langage de grande taille (LLMs) basés sur les Transformers. Ce changement a redéfini les objectifs et les priorités de la recherche, passant des ressources lexicales et sémantiques à la modélisation du langage et à la multimodalité. Dans cette étude, nous retraçons les tendances de recherche de la communauté italienne en LI et TAL à travers une analyse des contributions à CLiC-it, considéré comme la conférence italienne de référence dans ce domaine. Nous avons compilé les actes des 10 premières éditions de la conférence CLiC-it (de 2014 à 2024) dans le Corpus CLiC-it, offrant une analyse approfondie à la fois de ses métadonnées, incluant la provenance des auteurs, leur genre, leurs affiliations, et plus encore, ainsi que du contenu des articles eux-mêmes, qui abordent divers sujets. Notre objectif est de fournir aux communautés de recherche italienne et internationale des insights précieux sur les tendances émergentes et les développements clés au fil du temps, soutenant ainsi des décisions éclairées et des orientations futures dans le domaine.
English
Over the past decade, Computational Linguistics (CL) and Natural Language Processing (NLP) have evolved rapidly, especially with the advent of Transformer-based Large Language Models (LLMs). This shift has transformed research goals and priorities, from Lexical and Semantic Resources to Language Modelling and Multimodality. In this study, we track the research trends of the Italian CL and NLP community through an analysis of the contributions to CLiC-it, arguably the leading Italian conference in the field. We compile the proceedings from the first 10 editions of the CLiC-it conference (from 2014 to 2024) into the CLiC-it Corpus, providing a comprehensive analysis of both its metadata, including author provenance, gender, affiliations, and more, as well as the content of the papers themselves, which address various topics. Our goal is to provide the Italian and international research communities with valuable insights into emerging trends and key developments over time, supporting informed decisions and future directions in the field.
PDF01September 30, 2025