H2O Ecossistema Aberto para Modelos de Linguagem de Última Geração
H2O Open Ecosystem for State-of-the-art Large Language Models
October 17, 2023
Autores: Arno Candel, Jon McKinney, Philipp Singer, Pascal Pfeiffer, Maximilian Jeblick, Chun Ming Lee, Marcos V. Conde
cs.AI
Resumo
Os Modelos de Linguagem de Grande Escala (LLMs) representam uma revolução na IA. No entanto, eles também apresentam muitos riscos significativos, como a presença de textos tendenciosos, privados, protegidos por direitos autorais ou prejudiciais. Por esse motivo, precisamos de soluções abertas, transparentes e seguras. Apresentamos um ecossistema completo de código aberto para o desenvolvimento e teste de LLMs. O objetivo deste projeto é impulsionar alternativas abertas às abordagens de código fechado. Lançamos o h2oGPT, uma família de LLMs ajustados com precisão, variando de 7 a 70 bilhões de parâmetros. Também introduzimos o H2O LLM Studio, uma estrutura e interface gráfica sem código projetada para o ajuste fino, avaliação e implantação eficientes de LLMs, utilizando as técnicas mais recentes e avançadas. Nosso código e modelos são licenciados sob licenças totalmente permissivas Apache 2.0. Acreditamos que os modelos de linguagem de código aberto ajudam a impulsionar o desenvolvimento da IA, tornando-a mais acessível e confiável. A demonstração está disponível em: https://gpt.h2o.ai/
English
Large Language Models (LLMs) represent a revolution in AI. However, they also
pose many significant risks, such as the presence of biased, private,
copyrighted or harmful text. For this reason we need open, transparent and safe
solutions. We introduce a complete open-source ecosystem for developing and
testing LLMs. The goal of this project is to boost open alternatives to
closed-source approaches. We release h2oGPT, a family of fine-tuned LLMs from 7
to 70 Billion parameters. We also introduce H2O LLM Studio, a framework and
no-code GUI designed for efficient fine-tuning, evaluation, and deployment of
LLMs using the most recent state-of-the-art techniques. Our code and models are
licensed under fully permissive Apache 2.0 licenses. We believe open-source
language models help to boost AI development and make it more accessible and
trustworthy. The demo is available at: https://gpt.h2o.ai/