ChatPaper.aiChatPaper

H2O Open Ecosysteem voor State-of-the-art Grote Taalmodellen

H2O Open Ecosystem for State-of-the-art Large Language Models

October 17, 2023
Auteurs: Arno Candel, Jon McKinney, Philipp Singer, Pascal Pfeiffer, Maximilian Jeblick, Chun Ming Lee, Marcos V. Conde
cs.AI

Samenvatting

Grote Taalmodellen (LLMs) vertegenwoordigen een revolutie in AI. Ze brengen echter ook aanzienlijke risico's met zich mee, zoals de aanwezigheid van bevooroordeelde, privé-, auteursrechtelijk beschermde of schadelijke tekst. Daarom hebben we open, transparante en veilige oplossingen nodig. Wij introduceren een volledig open-source ecosysteem voor het ontwikkelen en testen van LLMs. Het doel van dit project is om open alternatieven voor gesloten bronbenaderingen te stimuleren. We brengen h2oGPT uit, een familie van fijn afgestemde LLMs met 7 tot 70 miljard parameters. Daarnaast introduceren we H2O LLM Studio, een framework en no-code GUI ontworpen voor efficiënte fijnafstemming, evaluatie en implementatie van LLMs met behulp van de meest recente state-of-the-art technieken. Onze code en modellen zijn gelicentieerd onder volledig permissieve Apache 2.0-licenties. Wij geloven dat open-source taalmodelen de ontwikkeling van AI bevorderen en deze toegankelijker en betrouwbaarder maken. De demo is beschikbaar op: https://gpt.h2o.ai/
English
Large Language Models (LLMs) represent a revolution in AI. However, they also pose many significant risks, such as the presence of biased, private, copyrighted or harmful text. For this reason we need open, transparent and safe solutions. We introduce a complete open-source ecosystem for developing and testing LLMs. The goal of this project is to boost open alternatives to closed-source approaches. We release h2oGPT, a family of fine-tuned LLMs from 7 to 70 Billion parameters. We also introduce H2O LLM Studio, a framework and no-code GUI designed for efficient fine-tuning, evaluation, and deployment of LLMs using the most recent state-of-the-art techniques. Our code and models are licensed under fully permissive Apache 2.0 licenses. We believe open-source language models help to boost AI development and make it more accessible and trustworthy. The demo is available at: https://gpt.h2o.ai/
PDF92February 8, 2026