Ecosistema Abierto H2O para Modelos de Lenguaje de Última Generación
H2O Open Ecosystem for State-of-the-art Large Language Models
October 17, 2023
Autores: Arno Candel, Jon McKinney, Philipp Singer, Pascal Pfeiffer, Maximilian Jeblick, Chun Ming Lee, Marcos V. Conde
cs.AI
Resumen
Los Modelos de Lenguaje a Gran Escala (LLMs, por sus siglas en inglés) representan una revolución en la inteligencia artificial. Sin embargo, también plantean riesgos significativos, como la presencia de texto sesgado, privado, protegido por derechos de autor o dañino. Por esta razón, necesitamos soluciones abiertas, transparentes y seguras. Presentamos un ecosistema completo de código abierto para el desarrollo y prueba de LLMs. El objetivo de este proyecto es impulsar alternativas abiertas frente a enfoques de código cerrado. Lanzamos h2oGPT, una familia de LLMs ajustados que van desde 7 hasta 70 mil millones de parámetros. También presentamos H2O LLM Studio, un marco de trabajo y una interfaz gráfica sin código diseñada para el ajuste fino, evaluación e implementación eficiente de LLMs utilizando las técnicas más avanzadas del estado del arte. Nuestro código y modelos están licenciados bajo licencias Apache 2.0 completamente permisivas. Creemos que los modelos de lenguaje de código abierto ayudan a impulsar el desarrollo de la IA, haciéndola más accesible y confiable. La demostración está disponible en: https://gpt.h2o.ai/
English
Large Language Models (LLMs) represent a revolution in AI. However, they also
pose many significant risks, such as the presence of biased, private,
copyrighted or harmful text. For this reason we need open, transparent and safe
solutions. We introduce a complete open-source ecosystem for developing and
testing LLMs. The goal of this project is to boost open alternatives to
closed-source approaches. We release h2oGPT, a family of fine-tuned LLMs from 7
to 70 Billion parameters. We also introduce H2O LLM Studio, a framework and
no-code GUI designed for efficient fine-tuning, evaluation, and deployment of
LLMs using the most recent state-of-the-art techniques. Our code and models are
licensed under fully permissive Apache 2.0 licenses. We believe open-source
language models help to boost AI development and make it more accessible and
trustworthy. The demo is available at: https://gpt.h2o.ai/