ChatPaper.aiChatPaper

Trazando una Década de Lingüística Computacional en Italia: El Corpus CLiC-it

Charting a Decade of Computational Linguistics in Italy: The CLiC-it Corpus

September 23, 2025
Autores: Chiara Alzetta, Serena Auriemma, Alessandro Bondielli, Luca Dini, Chiara Fazzone, Alessio Miaschi, Martina Miliani, Marta Sartor
cs.AI

Resumen

Durante la última década, la Lingüística Computacional (LC) y el Procesamiento del Lenguaje Natural (PLN) han evolucionado rápidamente, especialmente con el surgimiento de los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) basados en Transformers. Este cambio ha transformado los objetivos y prioridades de investigación, desde los Recursos Léxicos y Semánticos hacia el Modelado del Lenguaje y la Multimodalidad. En este estudio, rastreamos las tendencias de investigación de la comunidad italiana de LC y PLN a través de un análisis de las contribuciones a CLiC-it, considerada la principal conferencia italiana en el campo. Compilamos las actas de las primeras 10 ediciones de la conferencia CLiC-it (desde 2014 hasta 2024) en el Corpus CLiC-it, proporcionando un análisis exhaustivo tanto de sus metadatos, incluyendo la procedencia de los autores, género, afiliaciones y más, como del contenido de los artículos mismos, que abordan diversos temas. Nuestro objetivo es ofrecer a las comunidades de investigación italiana e internacional valiosas perspectivas sobre las tendencias emergentes y los desarrollos clave a lo largo del tiempo, apoyando decisiones informadas y futuras direcciones en el campo.
English
Over the past decade, Computational Linguistics (CL) and Natural Language Processing (NLP) have evolved rapidly, especially with the advent of Transformer-based Large Language Models (LLMs). This shift has transformed research goals and priorities, from Lexical and Semantic Resources to Language Modelling and Multimodality. In this study, we track the research trends of the Italian CL and NLP community through an analysis of the contributions to CLiC-it, arguably the leading Italian conference in the field. We compile the proceedings from the first 10 editions of the CLiC-it conference (from 2014 to 2024) into the CLiC-it Corpus, providing a comprehensive analysis of both its metadata, including author provenance, gender, affiliations, and more, as well as the content of the papers themselves, which address various topics. Our goal is to provide the Italian and international research communities with valuable insights into emerging trends and key developments over time, supporting informed decisions and future directions in the field.
PDF01September 30, 2025