ChatPaper.aiChatPaper

Una Cartografia della Collaborazione Aperta nell'IA Open Source: Mappatura di Pratiche, Motivazioni e Governance in 14 Progetti di Modelli Linguistici su Larga Scala Aperti

A Cartography of Open Collaboration in Open Source AI: Mapping Practices, Motivations, and Governance in 14 Open Large Language Model Projects

September 29, 2025
Autori: Johan Linåker, Cailean Osborne, Jennifer Ding, Ben Burtenshaw
cs.AI

Abstract

La proliferazione di modelli linguistici di grandi dimensioni (LLM) open source sta favorendo un ecosistema vivace di ricerca e innovazione nell'intelligenza artificiale (IA). Tuttavia, i metodi di collaborazione utilizzati per sviluppare LLM open source, sia prima che dopo il loro rilascio pubblico, non sono ancora stati studiati in modo esaustivo, limitando la nostra comprensione di come i progetti di LLM open source vengano avviati, organizzati e governati, nonché delle opportunità esistenti per favorire ulteriormente questo ecosistema. Colmiamo questa lacuna attraverso un'analisi esplorativa della collaborazione aperta lungo l'intero ciclo di vita dello sviluppo e del riutilizzo degli LLM open source, basandoci su interviste semi-strutturate con gli sviluppatori di 14 LLM open source provenienti da progetti grassroots, istituti di ricerca, startup e grandi aziende tecnologiche in Nord America, Europa, Africa e Asia. Forniamo tre contributi chiave alla ricerca e alla pratica. In primo luogo, la collaborazione nei progetti di LLM open source si estende ben oltre gli LLM stessi, comprendendo dataset, benchmark, framework open source, classifiche, forum di condivisione di conoscenze e discussioni, e partnership di calcolo, tra gli altri. In secondo luogo, gli sviluppatori di LLM open source hanno una varietà di motivazioni sociali, economiche e tecnologiche, dalla democratizzazione dell'accesso all'IA e la promozione della scienza aperta alla costruzione di ecosistemi regionali e all'ampliamento della rappresentazione linguistica. In terzo luogo, i progetti di LLM open source campionati mostrano cinque distinti modelli organizzativi, che vanno da progetti di singole aziende a progetti grassroots sponsorizzati da organizzazioni non profit, i quali variano nella centralizzazione del controllo e nelle strategie di coinvolgimento della comunità utilizzate lungo l'intero ciclo di vita degli LLM open source. Concludiamo con raccomandazioni pratiche per le parti interessate che cercano di sostenere la comunità globale nella costruzione di un futuro più aperto per l'IA.
English
The proliferation of open large language models (LLMs) is fostering a vibrant ecosystem of research and innovation in artificial intelligence (AI). However, the methods of collaboration used to develop open LLMs both before and after their public release have not yet been comprehensively studied, limiting our understanding of how open LLM projects are initiated, organized, and governed as well as what opportunities there are to foster this ecosystem even further. We address this gap through an exploratory analysis of open collaboration throughout the development and reuse lifecycle of open LLMs, drawing on semi-structured interviews with the developers of 14 open LLMs from grassroots projects, research institutes, startups, and Big Tech companies in North America, Europe, Africa, and Asia. We make three key contributions to research and practice. First, collaboration in open LLM projects extends far beyond the LLMs themselves, encompassing datasets, benchmarks, open source frameworks, leaderboards, knowledge sharing and discussion forums, and compute partnerships, among others. Second, open LLM developers have a variety of social, economic, and technological motivations, from democratizing AI access and promoting open science to building regional ecosystems and expanding language representation. Third, the sampled open LLM projects exhibit five distinct organizational models, ranging from single company projects to non-profit-sponsored grassroots projects, which vary in their centralization of control and community engagement strategies used throughout the open LLM lifecycle. We conclude with practical recommendations for stakeholders seeking to support the global community building a more open future for AI.
PDF92October 1, 2025