ChatPaper.aiChatPaper

Ecosistema Abierto H2O para Modelos de Lenguaje de Última Generación

H2O Open Ecosystem for State-of-the-art Large Language Models

October 17, 2023
Autores: Arno Candel, Jon McKinney, Philipp Singer, Pascal Pfeiffer, Maximilian Jeblick, Chun Ming Lee, Marcos V. Conde
cs.AI

Resumen

Los Modelos de Lenguaje a Gran Escala (LLMs, por sus siglas en inglés) representan una revolución en la inteligencia artificial. Sin embargo, también plantean riesgos significativos, como la presencia de texto sesgado, privado, protegido por derechos de autor o dañino. Por esta razón, necesitamos soluciones abiertas, transparentes y seguras. Presentamos un ecosistema completo de código abierto para el desarrollo y prueba de LLMs. El objetivo de este proyecto es impulsar alternativas abiertas frente a enfoques de código cerrado. Lanzamos h2oGPT, una familia de LLMs ajustados que van desde 7 hasta 70 mil millones de parámetros. También presentamos H2O LLM Studio, un marco de trabajo y una interfaz gráfica sin código diseñada para el ajuste fino, evaluación e implementación eficiente de LLMs utilizando las técnicas más avanzadas del estado del arte. Nuestro código y modelos están licenciados bajo licencias Apache 2.0 completamente permisivas. Creemos que los modelos de lenguaje de código abierto ayudan a impulsar el desarrollo de la IA, haciéndola más accesible y confiable. La demostración está disponible en: https://gpt.h2o.ai/
English
Large Language Models (LLMs) represent a revolution in AI. However, they also pose many significant risks, such as the presence of biased, private, copyrighted or harmful text. For this reason we need open, transparent and safe solutions. We introduce a complete open-source ecosystem for developing and testing LLMs. The goal of this project is to boost open alternatives to closed-source approaches. We release h2oGPT, a family of fine-tuned LLMs from 7 to 70 Billion parameters. We also introduce H2O LLM Studio, a framework and no-code GUI designed for efficient fine-tuning, evaluation, and deployment of LLMs using the most recent state-of-the-art techniques. Our code and models are licensed under fully permissive Apache 2.0 licenses. We believe open-source language models help to boost AI development and make it more accessible and trustworthy. The demo is available at: https://gpt.h2o.ai/
PDF82December 15, 2024