ChatPaper.aiChatPaper

Een decennium van computationele taalkunde in Italië in kaart gebracht: Het CLiC-it Corpus

Charting a Decade of Computational Linguistics in Italy: The CLiC-it Corpus

September 23, 2025
Auteurs: Chiara Alzetta, Serena Auriemma, Alessandro Bondielli, Luca Dini, Chiara Fazzone, Alessio Miaschi, Martina Miliani, Marta Sartor
cs.AI

Samenvatting

In het afgelopen decennium hebben Computationele Linguïstiek (CL) en Natural Language Processing (NLP) een snelle ontwikkeling doorgemaakt, vooral met de opkomst van Transformer-gebaseerde Large Language Models (LLMs). Deze verschuiving heeft de onderzoeksdoelen en -prioriteiten getransformeerd, van Lexicale en Semantische Bronnen naar Taalmodellering en Multimodaliteit. In deze studie volgen we de onderzoeksontwikkelingen van de Italiaanse CL- en NLP-gemeenschap door een analyse van de bijdragen aan CLiC-it, ongetwijfeld de belangrijkste Italiaanse conferentie op dit gebied. We hebben de proceedings van de eerste 10 edities van de CLiC-it conferentie (van 2014 tot 2024) samengebracht in het CLiC-it Corpus, waarbij we een uitgebreide analyse bieden van zowel de metadata, waaronder herkomst, geslacht en affiliaties van auteurs, als de inhoud van de papers zelf, die verschillende onderwerpen behandelen. Ons doel is om de Italiaanse en internationale onderzoeksgemeenschappen waardevolle inzichten te bieden in opkomende trends en belangrijke ontwikkelingen door de tijd heen, om zo geïnformeerde beslissingen en toekomstige richtingen in het veld te ondersteunen.
English
Over the past decade, Computational Linguistics (CL) and Natural Language Processing (NLP) have evolved rapidly, especially with the advent of Transformer-based Large Language Models (LLMs). This shift has transformed research goals and priorities, from Lexical and Semantic Resources to Language Modelling and Multimodality. In this study, we track the research trends of the Italian CL and NLP community through an analysis of the contributions to CLiC-it, arguably the leading Italian conference in the field. We compile the proceedings from the first 10 editions of the CLiC-it conference (from 2014 to 2024) into the CLiC-it Corpus, providing a comprehensive analysis of both its metadata, including author provenance, gender, affiliations, and more, as well as the content of the papers themselves, which address various topics. Our goal is to provide the Italian and international research communities with valuable insights into emerging trends and key developments over time, supporting informed decisions and future directions in the field.
PDF01September 30, 2025