ChatPaper.aiChatPaper

H2O Open Ecosystem für hochmoderne Large Language Models

H2O Open Ecosystem for State-of-the-art Large Language Models

October 17, 2023
Autoren: Arno Candel, Jon McKinney, Philipp Singer, Pascal Pfeiffer, Maximilian Jeblick, Chun Ming Lee, Marcos V. Conde
cs.AI

Zusammenfassung

Große Sprachmodelle (LLMs) stellen eine Revolution in der KI dar. Allerdings bergen sie auch viele erhebliche Risiken, wie das Vorhandensein von voreingenommenen, privaten, urheberrechtlich geschützten oder schädlichen Texten. Aus diesem Grund benötigen wir offene, transparente und sichere Lösungen. Wir stellen ein vollständiges Open-Source-Ökosystem für die Entwicklung und das Testen von LLMs vor. Das Ziel dieses Projekts ist es, offene Alternativen zu Closed-Source-Ansätzen zu fördern. Wir veröffentlichen h2oGPT, eine Familie von feinabgestimmten LLMs mit 7 bis 70 Milliarden Parametern. Zudem präsentieren wir H2O LLM Studio, ein Framework und eine No-Code-GUI, die für effizientes Feinabstimmen, Evaluieren und Bereitstellen von LLMs unter Verwendung der neuesten State-of-the-Art-Techniken entwickelt wurde. Unser Code und unsere Modelle sind unter vollständig freizügigen Apache-2.0-Lizenzen lizenziert. Wir glauben, dass Open-Source-Sprachmodelle die KI-Entwicklung vorantreiben und sie zugänglicher und vertrauenswürdiger machen. Die Demo ist verfügbar unter: https://gpt.h2o.ai/
English
Large Language Models (LLMs) represent a revolution in AI. However, they also pose many significant risks, such as the presence of biased, private, copyrighted or harmful text. For this reason we need open, transparent and safe solutions. We introduce a complete open-source ecosystem for developing and testing LLMs. The goal of this project is to boost open alternatives to closed-source approaches. We release h2oGPT, a family of fine-tuned LLMs from 7 to 70 Billion parameters. We also introduce H2O LLM Studio, a framework and no-code GUI designed for efficient fine-tuning, evaluation, and deployment of LLMs using the most recent state-of-the-art techniques. Our code and models are licensed under fully permissive Apache 2.0 licenses. We believe open-source language models help to boost AI development and make it more accessible and trustworthy. The demo is available at: https://gpt.h2o.ai/
PDF82December 15, 2024