ChatPaper.aiChatPaper

EXAONE 3.5: Serie großer Sprachmodelle für praxisnahe Anwendungsfälle

EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

December 6, 2024
Autoren: LG AI Research, Soyoung An, Kyunghoon Bae, Eunbi Choi, Kibong Choi, Stanley Jungkyu Choi, Seokhee Hong, Junwon Hwang, Hyojin Jeon, Gerrard Jeongwon Jo, Hyunjik Jo, Jiyeon Jung, Yountae Jung, Hyosang Kim, Joonkee Kim, Seonghwan Kim, Soyeon Kim, Sunkyoung Kim, Yireun Kim, Yongil Kim, Youchul Kim, Edward Hwayoung Lee, Haeju Lee, Honglak Lee, Jinsik Lee, Kyungmin Lee, Woohyung Lim, Sangha Park, Sooyoun Park, Yongmin Park, Sihoon Yang, Heuiyeen Yeen, Hyeongu Yun
cs.AI

Zusammenfassung

Dieser technische Bericht stellt die EXAONE 3.5 instruktionsangepassten Sprachmodelle vor, die von LG AI Research entwickelt und veröffentlicht wurden. Die EXAONE 3.5 Sprachmodelle werden in drei Konfigurationen angeboten: 32B, 7.8B und 2.4B. Diese Modelle zeichnen sich durch mehrere herausragende Fähigkeiten aus: 1) außergewöhnliche Anweisungsfolgefähigkeiten in realen Szenarien, die die höchsten Punktzahlen in sieben Benchmarks erreichen, 2) herausragendes Verständnis von langem Kontext, das die beste Leistung in vier Benchmarks erzielt, und 3) wettbewerbsfähige Ergebnisse im Vergleich zu modernsten offenen Modellen ähnlicher Größe in neun allgemeinen Benchmarks. Die EXAONE 3.5 Sprachmodelle stehen jedem zu Forschungszwecken offen und können von https://huggingface.co/LGAI-EXAONE heruntergeladen werden. Für kommerzielle Nutzung wenden Sie sich bitte an den offiziellen Kontakt von LG AI Research: [email protected].
English
This technical report introduces the EXAONE 3.5 instruction-tuned language models, developed and released by LG AI Research. The EXAONE 3.5 language models are offered in three configurations: 32B, 7.8B, and 2.4B. These models feature several standout capabilities: 1) exceptional instruction following capabilities in real-world scenarios, achieving the highest scores across seven benchmarks, 2) outstanding long-context comprehension, attaining the top performance in four benchmarks, and 3) competitive results compared to state-of-the-art open models of similar sizes across nine general benchmarks. The EXAONE 3.5 language models are open to anyone for research purposes and can be downloaded from https://huggingface.co/LGAI-EXAONE. For commercial use, please reach out to the official contact point of LG AI Research: [email protected].

Summary

AI-Generated Summary

PDF514December 9, 2024