Ecosistema Aperto H2O per Modelli Linguistici All'avanguardia di Grandi Dimensioni
H2O Open Ecosystem for State-of-the-art Large Language Models
October 17, 2023
Autori: Arno Candel, Jon McKinney, Philipp Singer, Pascal Pfeiffer, Maximilian Jeblick, Chun Ming Lee, Marcos V. Conde
cs.AI
Abstract
I modelli linguistici di grandi dimensioni (LLM) rappresentano una rivoluzione nell'ambito dell'IA. Tuttavia, presentano anche molti rischi significativi, come la presenza di testi distorti, privati, protetti da copyright o dannosi. Per questo motivo, abbiamo bisogno di soluzioni aperte, trasparenti e sicure. Introduciamo un ecosistema open-source completo per lo sviluppo e il testing degli LLM. L'obiettivo di questo progetto è promuovere alternative aperte agli approcci closed-source. Rilasciamo h2oGPT, una famiglia di LLM ottimizzati che vanno da 7 a 70 miliardi di parametri. Presentiamo inoltre H2O LLM Studio, un framework e un'interfaccia grafica no-code progettati per l'ottimizzazione, la valutazione e il deployment efficiente degli LLM utilizzando le tecniche più avanzate. Il nostro codice e i nostri modelli sono rilasciati con licenze completamente permissive Apache 2.0. Crediamo che i modelli linguistici open-source contribuiscano a promuovere lo sviluppo dell'IA, rendendola più accessibile e affidabile. La demo è disponibile all'indirizzo: https://gpt.h2o.ai/
English
Large Language Models (LLMs) represent a revolution in AI. However, they also
pose many significant risks, such as the presence of biased, private,
copyrighted or harmful text. For this reason we need open, transparent and safe
solutions. We introduce a complete open-source ecosystem for developing and
testing LLMs. The goal of this project is to boost open alternatives to
closed-source approaches. We release h2oGPT, a family of fine-tuned LLMs from 7
to 70 Billion parameters. We also introduce H2O LLM Studio, a framework and
no-code GUI designed for efficient fine-tuning, evaluation, and deployment of
LLMs using the most recent state-of-the-art techniques. Our code and models are
licensed under fully permissive Apache 2.0 licenses. We believe open-source
language models help to boost AI development and make it more accessible and
trustworthy. The demo is available at: https://gpt.h2o.ai/