ChatPaper.aiChatPaper

H2O Ecossistema Aberto para Modelos de Linguagem de Última Geração

H2O Open Ecosystem for State-of-the-art Large Language Models

October 17, 2023
Autores: Arno Candel, Jon McKinney, Philipp Singer, Pascal Pfeiffer, Maximilian Jeblick, Chun Ming Lee, Marcos V. Conde
cs.AI

Resumo

Os Modelos de Linguagem de Grande Escala (LLMs) representam uma revolução na IA. No entanto, eles também apresentam muitos riscos significativos, como a presença de textos tendenciosos, privados, protegidos por direitos autorais ou prejudiciais. Por esse motivo, precisamos de soluções abertas, transparentes e seguras. Apresentamos um ecossistema completo de código aberto para o desenvolvimento e teste de LLMs. O objetivo deste projeto é impulsionar alternativas abertas às abordagens de código fechado. Lançamos o h2oGPT, uma família de LLMs ajustados com precisão, variando de 7 a 70 bilhões de parâmetros. Também introduzimos o H2O LLM Studio, uma estrutura e interface gráfica sem código projetada para o ajuste fino, avaliação e implantação eficientes de LLMs, utilizando as técnicas mais recentes e avançadas. Nosso código e modelos são licenciados sob licenças totalmente permissivas Apache 2.0. Acreditamos que os modelos de linguagem de código aberto ajudam a impulsionar o desenvolvimento da IA, tornando-a mais acessível e confiável. A demonstração está disponível em: https://gpt.h2o.ai/
English
Large Language Models (LLMs) represent a revolution in AI. However, they also pose many significant risks, such as the presence of biased, private, copyrighted or harmful text. For this reason we need open, transparent and safe solutions. We introduce a complete open-source ecosystem for developing and testing LLMs. The goal of this project is to boost open alternatives to closed-source approaches. We release h2oGPT, a family of fine-tuned LLMs from 7 to 70 Billion parameters. We also introduce H2O LLM Studio, a framework and no-code GUI designed for efficient fine-tuning, evaluation, and deployment of LLMs using the most recent state-of-the-art techniques. Our code and models are licensed under fully permissive Apache 2.0 licenses. We believe open-source language models help to boost AI development and make it more accessible and trustworthy. The demo is available at: https://gpt.h2o.ai/
PDF92February 8, 2026