Eine Kartographie der offenen Zusammenarbeit in Open-Source-KI: Praktiken, Motivationen und Governance in 14 Open Large Language Model Projekten
A Cartography of Open Collaboration in Open Source AI: Mapping Practices, Motivations, and Governance in 14 Open Large Language Model Projects
September 29, 2025
papers.authors: Johan Linåker, Cailean Osborne, Jennifer Ding, Ben Burtenshaw
cs.AI
papers.abstract
Die Verbreitung offener großer Sprachmodelle (LLMs) fördert ein lebendiges Ökosystem aus Forschung und Innovation im Bereich der künstlichen Intelligenz (KI). Allerdings wurden die Methoden der Zusammenarbeit, die zur Entwicklung offener LLMs sowohl vor als auch nach ihrer Veröffentlichung verwendet werden, bisher noch nicht umfassend untersucht. Dies schränkt unser Verständnis davon ein, wie offene LLM-Projekte initiiert, organisiert und gesteuert werden sowie welche Möglichkeiten bestehen, dieses Ökosystem weiter zu stärken. Wir schließen diese Lücke durch eine explorative Analyse der offenen Zusammenarbeit während des gesamten Entwicklungs- und Wiederverwendungszyklus offener LLMs, basierend auf halbstrukturierten Interviews mit den Entwicklern von 14 offenen LLMs aus Graswurzelprojekten, Forschungseinrichtungen, Startups und Großunternehmen in Nordamerika, Europa, Afrika und Asien. Wir leisten drei zentrale Beiträge für Forschung und Praxis. Erstens erstreckt sich die Zusammenarbeit in offenen LLM-Projekten weit über die LLMs selbst hinaus und umfasst Datensätze, Benchmarks, Open-Source-Frameworks, Ranglisten, Wissensaustausch- und Diskussionsforen sowie Rechenpartnerschaften, um nur einige zu nennen. Zweitens haben die Entwickler offener LLMs eine Vielzahl sozialer, wirtschaftlicher und technologischer Motivationen, von der Demokratisierung des KI-Zugangs und der Förderung der offenen Wissenschaft bis hin zum Aufbau regionaler Ökosysteme und der Erweiterung der Sprachrepräsentation. Drittens zeigen die untersuchten offenen LLM-Projekte fünf unterschiedliche Organisationsmodelle, die von Einzelunternehmensprojekten bis hin zu von gemeinnützigen Organisationen unterstützten Graswurzelprojekten reichen und sich in ihrer Zentralisierung der Kontrolle und den Strategien zur Einbindung der Gemeinschaft während des gesamten LLM-Lebenszyklus unterscheiden. Wir schließen mit praktischen Empfehlungen für Stakeholder, die die globale Gemeinschaft bei der Schaffung einer offeneren Zukunft für die KI unterstützen möchten.
English
The proliferation of open large language models (LLMs) is fostering a vibrant
ecosystem of research and innovation in artificial intelligence (AI). However,
the methods of collaboration used to develop open LLMs both before and after
their public release have not yet been comprehensively studied, limiting our
understanding of how open LLM projects are initiated, organized, and governed
as well as what opportunities there are to foster this ecosystem even further.
We address this gap through an exploratory analysis of open collaboration
throughout the development and reuse lifecycle of open LLMs, drawing on
semi-structured interviews with the developers of 14 open LLMs from grassroots
projects, research institutes, startups, and Big Tech companies in North
America, Europe, Africa, and Asia. We make three key contributions to research
and practice. First, collaboration in open LLM projects extends far beyond the
LLMs themselves, encompassing datasets, benchmarks, open source frameworks,
leaderboards, knowledge sharing and discussion forums, and compute
partnerships, among others. Second, open LLM developers have a variety of
social, economic, and technological motivations, from democratizing AI access
and promoting open science to building regional ecosystems and expanding
language representation. Third, the sampled open LLM projects exhibit five
distinct organizational models, ranging from single company projects to
non-profit-sponsored grassroots projects, which vary in their centralization of
control and community engagement strategies used throughout the open LLM
lifecycle. We conclude with practical recommendations for stakeholders seeking
to support the global community building a more open future for AI.