Картография открытого сотрудничества в области открытого ИИ: анализ практик, мотиваций и управления в 14 проектах открытых больших языковых моделей
A Cartography of Open Collaboration in Open Source AI: Mapping Practices, Motivations, and Governance in 14 Open Large Language Model Projects
September 29, 2025
Авторы: Johan Linåker, Cailean Osborne, Jennifer Ding, Ben Burtenshaw
cs.AI
Аннотация
Распространение открытых больших языковых моделей (LLM) способствует развитию динамичной экосистемы исследований и инноваций в области искусственного интеллекта (ИИ). Однако методы сотрудничества, используемые для разработки открытых LLM как до, так и после их публичного выпуска, до сих пор не были всесторонне изучены, что ограничивает наше понимание того, как инициируются, организуются и управляются проекты открытых LLM, а также какие возможности существуют для дальнейшего развития этой экосистемы. Мы восполняем этот пробел с помощью исследовательского анализа открытого сотрудничества на протяжении всего жизненного цикла разработки и повторного использования открытых LLM, основываясь на полуструктурированных интервью с разработчиками 14 открытых LLM из проектов на уровне сообществ, исследовательских институтов, стартапов и крупных технологических компаний Северной Америки, Европы, Африки и Азии. Мы делаем три ключевых вклада в исследования и практику. Во-первых, сотрудничество в проектах открытых LLM выходит далеко за рамки самих моделей, охватывая наборы данных, бенчмарки, открытые фреймворки, рейтинги, платформы для обмена знаниями и дискуссий, а также партнерства в области вычислительных ресурсов. Во-вторых, разработчики открытых LLM руководствуются разнообразными социальными, экономическими и технологическими мотивами, начиная от демократизации доступа к ИИ и продвижения открытой науки до создания региональных экосистем и расширения языкового представительства. В-третьих, исследуемые проекты открытых LLM демонстрируют пять различных организационных моделей, начиная от проектов отдельных компаний до проектов на уровне сообществ, спонсируемых некоммерческими организациями, которые различаются по степени централизации контроля и стратегиям вовлечения сообщества на протяжении жизненного цикла открытых LLM. Мы завершаем работу практическими рекомендациями для заинтересованных сторон, стремящихся поддержать глобальное сообщество в создании более открытого будущего для ИИ.
English
The proliferation of open large language models (LLMs) is fostering a vibrant
ecosystem of research and innovation in artificial intelligence (AI). However,
the methods of collaboration used to develop open LLMs both before and after
their public release have not yet been comprehensively studied, limiting our
understanding of how open LLM projects are initiated, organized, and governed
as well as what opportunities there are to foster this ecosystem even further.
We address this gap through an exploratory analysis of open collaboration
throughout the development and reuse lifecycle of open LLMs, drawing on
semi-structured interviews with the developers of 14 open LLMs from grassroots
projects, research institutes, startups, and Big Tech companies in North
America, Europe, Africa, and Asia. We make three key contributions to research
and practice. First, collaboration in open LLM projects extends far beyond the
LLMs themselves, encompassing datasets, benchmarks, open source frameworks,
leaderboards, knowledge sharing and discussion forums, and compute
partnerships, among others. Second, open LLM developers have a variety of
social, economic, and technological motivations, from democratizing AI access
and promoting open science to building regional ecosystems and expanding
language representation. Third, the sampled open LLM projects exhibit five
distinct organizational models, ranging from single company projects to
non-profit-sponsored grassroots projects, which vary in their centralization of
control and community engagement strategies used throughout the open LLM
lifecycle. We conclude with practical recommendations for stakeholders seeking
to support the global community building a more open future for AI.