ChatPaper.aiChatPaper

Mapeando uma Década de Linguística Computacional na Itália: O Corpus CLiC-it

Charting a Decade of Computational Linguistics in Italy: The CLiC-it Corpus

September 23, 2025
Autores: Chiara Alzetta, Serena Auriemma, Alessandro Bondielli, Luca Dini, Chiara Fazzone, Alessio Miaschi, Martina Miliani, Marta Sartor
cs.AI

Resumo

Na última década, a Linguística Computacional (LC) e o Processamento de Linguagem Natural (PLN) evoluíram rapidamente, especialmente com o advento dos Modelos de Linguagem de Grande Escala (LLMs) baseados em Transformers. Essa mudança transformou os objetivos e prioridades de pesquisa, passando de Recursos Lexicais e Semânticos para Modelagem de Linguagem e Multimodalidade. Neste estudo, acompanhamos as tendências de pesquisa da comunidade italiana de LC e PLN por meio de uma análise das contribuições para o CLiC-it, considerada a principal conferência italiana na área. Compilamos os anais das primeiras 10 edições da conferência CLiC-it (de 2014 a 2024) no Corpus CLiC-it, fornecendo uma análise abrangente tanto de seus metadados, incluindo proveniência dos autores, gênero, afiliações e mais, quanto do conteúdo dos artigos em si, que abordam diversos tópicos. Nosso objetivo é fornecer às comunidades de pesquisa italiana e internacional insights valiosos sobre tendências emergentes e desenvolvimentos-chave ao longo do tempo, apoiando decisões informadas e direcionamentos futuros no campo.
English
Over the past decade, Computational Linguistics (CL) and Natural Language Processing (NLP) have evolved rapidly, especially with the advent of Transformer-based Large Language Models (LLMs). This shift has transformed research goals and priorities, from Lexical and Semantic Resources to Language Modelling and Multimodality. In this study, we track the research trends of the Italian CL and NLP community through an analysis of the contributions to CLiC-it, arguably the leading Italian conference in the field. We compile the proceedings from the first 10 editions of the CLiC-it conference (from 2014 to 2024) into the CLiC-it Corpus, providing a comprehensive analysis of both its metadata, including author provenance, gender, affiliations, and more, as well as the content of the papers themselves, which address various topics. Our goal is to provide the Italian and international research communities with valuable insights into emerging trends and key developments over time, supporting informed decisions and future directions in the field.
PDF01September 30, 2025