ChatPaper.aiChatPaper

H2O: Открытая экосистема для современных крупных языковых моделей

H2O Open Ecosystem for State-of-the-art Large Language Models

October 17, 2023
Авторы: Arno Candel, Jon McKinney, Philipp Singer, Pascal Pfeiffer, Maximilian Jeblick, Chun Ming Lee, Marcos V. Conde
cs.AI

Аннотация

Крупные языковые модели (LLMs) представляют собой революцию в области искусственного интеллекта. Однако они также несут в себе множество значительных рисков, таких как наличие предвзятых, конфиденциальных, защищённых авторским правом или вредоносных текстов. По этой причине нам необходимы открытые, прозрачные и безопасные решения. Мы представляем полную экосистему с открытым исходным кодом для разработки и тестирования LLMs. Цель этого проекта — стимулировать развитие открытых альтернатив закрытым подходам. Мы выпускаем h2oGPT — семейство тонко настроенных LLMs с количеством параметров от 7 до 70 миллиардов. Также мы представляем H2O LLM Studio — фреймворк и графический интерфейс без необходимости написания кода, предназначенный для эффективной тонкой настройки, оценки и развёртывания LLMs с использованием самых современных передовых технологий. Наш код и модели распространяются под полностью разрешительной лицензией Apache 2.0. Мы считаем, что языковые модели с открытым исходным кодом способствуют ускорению развития ИИ, делая его более доступным и заслуживающим доверия. Демонстрация доступна по адресу: https://gpt.h2o.ai/
English
Large Language Models (LLMs) represent a revolution in AI. However, they also pose many significant risks, such as the presence of biased, private, copyrighted or harmful text. For this reason we need open, transparent and safe solutions. We introduce a complete open-source ecosystem for developing and testing LLMs. The goal of this project is to boost open alternatives to closed-source approaches. We release h2oGPT, a family of fine-tuned LLMs from 7 to 70 Billion parameters. We also introduce H2O LLM Studio, a framework and no-code GUI designed for efficient fine-tuning, evaluation, and deployment of LLMs using the most recent state-of-the-art techniques. Our code and models are licensed under fully permissive Apache 2.0 licenses. We believe open-source language models help to boost AI development and make it more accessible and trustworthy. The demo is available at: https://gpt.h2o.ai/
PDF82December 15, 2024