ChatPaper.aiChatPaper

GPT4All: 오픈 소스 압축 언어 모델 생태계

GPT4All: An Ecosystem of Open Source Compressed Language Models

November 6, 2023
저자: Yuvanesh Anand, Zach Nussbaum, Adam Treat, Aaron Miller, Richard Guo, Ben Schmidt, GPT4All Community, Brandon Duderstadt, Andriy Mulyar
cs.AI

초록

대형 언어 모델(LLM)은 최근 다양한 전문 및 학술 벤치마크에서 인간 수준의 성능을 달성했습니다. 그러나 이러한 모델의 접근성은 그 성능에 비해 뒤처져 있습니다. 최첨단 LLM은 비용이 많이 드는 인프라가 필요하며, 속도 제한, 지역 차단, 검열이 적용된 웹 인터페이스를 통해서만 접근할 수 있고, 공개된 코드와 기술 보고서가 부족합니다. 본 논문에서는 LLM 접근성을 민주화하려는 인기 있는 오픈소스 저장소인 GPT4All의 이야기를 소개합니다. 우리는 원래 GPT4All 모델 패밀리의 기술적 세부 사항과 GPT4All 프로젝트가 단일 모델에서 완전한 오픈소스 생태계로 진화한 과정을 설명합니다. 이 논문이 원래 GPT4All 모델에 대한 기술적 개요뿐만 아니라 GPT4All 오픈소스 생태계의 성장에 대한 사례 연구로도 활용되기를 바랍니다.
English
Large language models (LLMs) have recently achieved human-level performance on a range of professional and academic benchmarks. The accessibility of these models has lagged behind their performance. State-of-the-art LLMs require costly infrastructure; are only accessible via rate-limited, geo-locked, and censored web interfaces; and lack publicly available code and technical reports. In this paper, we tell the story of GPT4All, a popular open source repository that aims to democratize access to LLMs. We outline the technical details of the original GPT4All model family, as well as the evolution of the GPT4All project from a single model into a fully fledged open source ecosystem. It is our hope that this paper acts as both a technical overview of the original GPT4All models as well as a case study on the subsequent growth of the GPT4All open source ecosystem.
PDF231December 15, 2024