오픈 인텔리전스의 경제학: 모델 생태계에서 권력과 참여의 흔적을 따라
Economies of Open Intelligence: Tracing Power & Participation in the Model Ecosystem
November 27, 2025
저자: Shayne Longpre, Christopher Akiki, Campbell Lund, Atharva Kulkarni, Emily Chen, Irene Solaiman, Avijit Ghosh, Yacine Jernite, Lucie-Aimée Kaffee
cs.AI
초록
2019년 이후 허깅 페이스 모델 허브는 오픈 웨이트 AI 모델 공유의 주요 글로벌 플랫폼으로 자리잡았습니다. 주간 모델 다운로드 전체 기록(2020년 6월~2025년 8월) 데이터셋과 모델 메타데이터를 공개함으로써, 우리는 오픈 모델 경제에서의 집중도 변화와 진화하는 특성에 대해 지금까지 가장 엄밀한 분석을 제공합니다. 우리의 분석은 851,000개의 모델, 모델당 200개 이상의 종합 속성, 22억 건의 다운로드 데이터를 포괄합니다. 우리는 경제적 힘의 근본적인 재편을 확인했습니다: Google, Meta, OpenAI의 미국 오픈웨이트 업계 지배력은 소속 없는 개발자들과 커뮤니티 조직, 그리고 2025년 기준 중국 업계에 유리하게 급격히 감소했으며, DeepSeek과 Qwen 모델들이 시장 지배력의 새로운 집중화를 예고할 가능성이 있습니다. 우리는 모델 속성의 통계적으로 유의미한 변화, 평균 모델 크기의 17배 증가, 멀티모달 생성(3.4배), 양자화(5배), Mixture-of-Experts 아키텍처(7배)의 급속한 성장과 더불어 데이터 투명성의 우려스러운 감소를 확인했으며, 오픈 웨이트 모델이 2025년 처음으로 진정한 오픈 소스 모델을 추월했습니다. 우리는 효율성과 예술적 표현을 위해 기본 모델을 양자화하고 적용하는 데 주력하는 새로운 계층의 개발자 중개자들이 등장했음을 밝혀냅니다. 지속적인 연구와 감독을 가능하게 하기 위해, 우리는 오픈 모델 경제의 집중도 변화와 진화하는 속성을 실시간으로 모니터링할 수 있는 대시보드와 함께 완전한 데이터셋을 공개합니다.
English
Since 2019, the Hugging Face Model Hub has been the primary global platform for sharing open weight AI models. By releasing a dataset of the complete history of weekly model downloads (June 2020-August 2025) alongside model metadata, we provide the most rigorous examination to-date of concentration dynamics and evolving characteristics in the open model economy. Our analysis spans 851,000 models, over 200 aggregated attributes per model, and 2.2B downloads. We document a fundamental rebalancing of economic power: US open-weight industry dominance by Google, Meta, and OpenAI has declined sharply in favor of unaffiliated developers, community organizations, and, as of 2025, Chinese industry, with DeepSeek and Qwen models potentially heralding a new consolidation of market power. We identify statistically significant shifts in model properties, a 17X increase in average model size, rapid growth in multimodal generation (3.4X), quantization (5X), and mixture-of-experts architectures (7X), alongside concerning declines in data transparency, with open weights models surpassing truly open source models for the first time in 2025. We expose a new layer of developer intermediaries that has emerged, focused on quantizing and adapting base models for both efficiency and artistic expression. To enable continued research and oversight, we release the complete dataset with an interactive dashboard for real-time monitoring of concentration dynamics and evolving properties in the open model economy.