H2O: Открытая экосистема для современных крупных языковых моделей
H2O Open Ecosystem for State-of-the-art Large Language Models
October 17, 2023
Авторы: Arno Candel, Jon McKinney, Philipp Singer, Pascal Pfeiffer, Maximilian Jeblick, Chun Ming Lee, Marcos V. Conde
cs.AI
Аннотация
Крупные языковые модели (LLMs) представляют собой революцию в области искусственного интеллекта. Однако они также несут в себе множество значительных рисков, таких как наличие предвзятых, конфиденциальных, защищённых авторским правом или вредоносных текстов. По этой причине нам необходимы открытые, прозрачные и безопасные решения. Мы представляем полную экосистему с открытым исходным кодом для разработки и тестирования LLMs. Цель этого проекта — стимулировать развитие открытых альтернатив закрытым подходам. Мы выпускаем h2oGPT — семейство тонко настроенных LLMs с количеством параметров от 7 до 70 миллиардов. Также мы представляем H2O LLM Studio — фреймворк и графический интерфейс без необходимости написания кода, предназначенный для эффективной тонкой настройки, оценки и развёртывания LLMs с использованием самых современных передовых технологий. Наш код и модели распространяются под полностью разрешительной лицензией Apache 2.0. Мы считаем, что языковые модели с открытым исходным кодом способствуют ускорению развития ИИ, делая его более доступным и заслуживающим доверия. Демонстрация доступна по адресу: https://gpt.h2o.ai/
English
Large Language Models (LLMs) represent a revolution in AI. However, they also
pose many significant risks, such as the presence of biased, private,
copyrighted or harmful text. For this reason we need open, transparent and safe
solutions. We introduce a complete open-source ecosystem for developing and
testing LLMs. The goal of this project is to boost open alternatives to
closed-source approaches. We release h2oGPT, a family of fine-tuned LLMs from 7
to 70 Billion parameters. We also introduce H2O LLM Studio, a framework and
no-code GUI designed for efficient fine-tuning, evaluation, and deployment of
LLMs using the most recent state-of-the-art techniques. Our code and models are
licensed under fully permissive Apache 2.0 licenses. We believe open-source
language models help to boost AI development and make it more accessible and
trustworthy. The demo is available at: https://gpt.h2o.ai/