EXAONE 3.5: Série de Modelos de Linguagem Grandes para Casos de Uso do Mundo Real
EXAONE 3.5: Series of Large Language Models for Real-world Use Cases
December 6, 2024
Autores: LG AI Research, Soyoung An, Kyunghoon Bae, Eunbi Choi, Kibong Choi, Stanley Jungkyu Choi, Seokhee Hong, Junwon Hwang, Hyojin Jeon, Gerrard Jeongwon Jo, Hyunjik Jo, Jiyeon Jung, Yountae Jung, Hyosang Kim, Joonkee Kim, Seonghwan Kim, Soyeon Kim, Sunkyoung Kim, Yireun Kim, Yongil Kim, Youchul Kim, Edward Hwayoung Lee, Haeju Lee, Honglak Lee, Jinsik Lee, Kyungmin Lee, Woohyung Lim, Sangha Park, Sooyoun Park, Yongmin Park, Sihoon Yang, Heuiyeen Yeen, Hyeongu Yun
cs.AI
Resumo
Este relatório técnico apresenta os modelos de linguagem EXAONE 3.5 ajustados para instruções, desenvolvidos e lançados pela LG AI Research. Os modelos de linguagem EXAONE 3.5 são oferecidos em três configurações: 32B, 7.8B e 2.4B. Esses modelos apresentam várias capacidades excepcionais: 1) capacidades excepcionais de seguir instruções em cenários do mundo real, alcançando as pontuações mais altas em sete benchmarks, 2) excelente compreensão de contexto longo, obtendo o melhor desempenho em quatro benchmarks, e 3) resultados competitivos em comparação com modelos abertos de última geração de tamanhos semelhantes em nove benchmarks gerais. Os modelos de linguagem EXAONE 3.5 estão disponíveis para qualquer pessoa para fins de pesquisa e podem ser baixados em https://huggingface.co/LGAI-EXAONE. Para uso comercial, entre em contato com o ponto de contato oficial da LG AI Research: [email protected].
English
This technical report introduces the EXAONE 3.5 instruction-tuned language
models, developed and released by LG AI Research. The EXAONE 3.5 language
models are offered in three configurations: 32B, 7.8B, and 2.4B. These models
feature several standout capabilities: 1) exceptional instruction following
capabilities in real-world scenarios, achieving the highest scores across seven
benchmarks, 2) outstanding long-context comprehension, attaining the top
performance in four benchmarks, and 3) competitive results compared to
state-of-the-art open models of similar sizes across nine general benchmarks.
The EXAONE 3.5 language models are open to anyone for research purposes and can
be downloaded from https://huggingface.co/LGAI-EXAONE. For commercial use,
please reach out to the official contact point of LG AI Research:
[email protected].Summary
AI-Generated Summary