ChatPaper.aiChatPaper

Eine Dekade der Computerlinguistik in Italien: Das CLiC-it-Korpus

Charting a Decade of Computational Linguistics in Italy: The CLiC-it Corpus

September 23, 2025
papers.authors: Chiara Alzetta, Serena Auriemma, Alessandro Bondielli, Luca Dini, Chiara Fazzone, Alessio Miaschi, Martina Miliani, Marta Sartor
cs.AI

papers.abstract

In den letzten zehn Jahren haben sich die Computerlinguistik (CL) und die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) rasant weiterentwickelt, insbesondere mit dem Aufkommen von Transformer-basierten Large Language Models (LLMs). Dieser Wandel hat die Forschungsziele und -prioritäten verändert, von lexikalischen und semantischen Ressourcen hin zu Sprachmodellierung und Multimodalität. In dieser Studie verfolgen wir die Forschungstrends der italienischen CL- und NLP-Gemeinschaft durch eine Analyse der Beiträge zu CLiC-it, der wohl führenden italienischen Konferenz in diesem Bereich. Wir haben die Proceedings der ersten 10 Ausgaben der CLiC-it-Konferenz (von 2014 bis 2024) zum CLiC-it-Korpus zusammengestellt und bieten eine umfassende Analyse sowohl der Metadaten, einschließlich Herkunft, Geschlecht, Zugehörigkeiten der Autoren und mehr, als auch der Inhalte der Beiträge selbst, die verschiedene Themen behandeln. Unser Ziel ist es, der italienischen und internationalen Forschungsgemeinschaft wertvolle Einblicke in aufkommende Trends und Schlüsselentwicklungen im Laufe der Zeit zu bieten, um fundierte Entscheidungen und zukünftige Richtungen in diesem Bereich zu unterstützen.
English
Over the past decade, Computational Linguistics (CL) and Natural Language Processing (NLP) have evolved rapidly, especially with the advent of Transformer-based Large Language Models (LLMs). This shift has transformed research goals and priorities, from Lexical and Semantic Resources to Language Modelling and Multimodality. In this study, we track the research trends of the Italian CL and NLP community through an analysis of the contributions to CLiC-it, arguably the leading Italian conference in the field. We compile the proceedings from the first 10 editions of the CLiC-it conference (from 2014 to 2024) into the CLiC-it Corpus, providing a comprehensive analysis of both its metadata, including author provenance, gender, affiliations, and more, as well as the content of the papers themselves, which address various topics. Our goal is to provide the Italian and international research communities with valuable insights into emerging trends and key developments over time, supporting informed decisions and future directions in the field.
PDF01September 30, 2025