ChatPaper.aiChatPaper

Картирование десятилетия вычислительной лингвистики в Италии: корпус CLiC-it

Charting a Decade of Computational Linguistics in Italy: The CLiC-it Corpus

September 23, 2025
Авторы: Chiara Alzetta, Serena Auriemma, Alessandro Bondielli, Luca Dini, Chiara Fazzone, Alessio Miaschi, Martina Miliani, Marta Sartor
cs.AI

Аннотация

За последнее десятилетие вычислительная лингвистика (Computational Linguistics, CL) и обработка естественного языка (Natural Language Processing, NLP) стремительно развивались, особенно с появлением крупных языковых моделей на основе архитектуры Transformer (Large Language Models, LLMs). Этот сдвиг изменил цели и приоритеты исследований, сместив фокус с лексических и семантических ресурсов на языковое моделирование и мультимодальность. В данном исследовании мы отслеживаем тенденции в итальянском сообществе CL и NLP, анализируя материалы, представленные на конференции CLiC-it, которая, несомненно, является ведущей конференцией в этой области в Италии. Мы собрали материалы первых 10 выпусков конференции CLiC-it (с 2014 по 2024 год) в корпус CLiC-it Corpus, предоставив всесторонний анализ как метаданных, включая происхождение авторов, их пол, принадлежность к учреждениям и другие параметры, так и содержания самих статей, посвященных различным темам. Наша цель — предоставить итальянскому и международному научному сообществу ценные инсайты о возникающих тенденциях и ключевых разработках с течением времени, способствуя принятию обоснованных решений и определению будущих направлений в этой области.
English
Over the past decade, Computational Linguistics (CL) and Natural Language Processing (NLP) have evolved rapidly, especially with the advent of Transformer-based Large Language Models (LLMs). This shift has transformed research goals and priorities, from Lexical and Semantic Resources to Language Modelling and Multimodality. In this study, we track the research trends of the Italian CL and NLP community through an analysis of the contributions to CLiC-it, arguably the leading Italian conference in the field. We compile the proceedings from the first 10 editions of the CLiC-it conference (from 2014 to 2024) into the CLiC-it Corpus, providing a comprehensive analysis of both its metadata, including author provenance, gender, affiliations, and more, as well as the content of the papers themselves, which address various topics. Our goal is to provide the Italian and international research communities with valuable insights into emerging trends and key developments over time, supporting informed decisions and future directions in the field.
PDF01September 30, 2025