ChatPaper.aiChatPaper

EXAONE 3.5 : Série de grands modèles de langage pour des cas d'utilisation réels

EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

December 6, 2024
Auteurs: LG AI Research, Soyoung An, Kyunghoon Bae, Eunbi Choi, Kibong Choi, Stanley Jungkyu Choi, Seokhee Hong, Junwon Hwang, Hyojin Jeon, Gerrard Jeongwon Jo, Hyunjik Jo, Jiyeon Jung, Yountae Jung, Hyosang Kim, Joonkee Kim, Seonghwan Kim, Soyeon Kim, Sunkyoung Kim, Yireun Kim, Yongil Kim, Youchul Kim, Edward Hwayoung Lee, Haeju Lee, Honglak Lee, Jinsik Lee, Kyungmin Lee, Woohyung Lim, Sangha Park, Sooyoun Park, Yongmin Park, Sihoon Yang, Heuiyeen Yeen, Hyeongu Yun
cs.AI

Résumé

Ce rapport technique présente les modèles de langage EXAONE 3.5 optimisés par instructions, développés et publiés par LG AI Research. Les modèles de langage EXAONE 3.5 sont proposés en trois configurations : 32B, 7.8B et 2.4B. Ces modèles présentent plusieurs capacités remarquables : 1) des capacités exceptionnelles de suivi des instructions dans des scénarios réels, atteignant les scores les plus élevés sur sept benchmarks, 2) une excellente compréhension du contexte étendu, obtenant les meilleures performances sur quatre benchmarks, et 3) des résultats compétitifs par rapport aux modèles ouverts de pointe de tailles similaires sur neuf benchmarks généraux. Les modèles de langage EXAONE 3.5 sont ouverts à tous à des fins de recherche et peuvent être téléchargés depuis https://huggingface.co/LGAI-EXAONE. Pour une utilisation commerciale, veuillez contacter le point de contact officiel de LG AI Research : [email protected].
English
This technical report introduces the EXAONE 3.5 instruction-tuned language models, developed and released by LG AI Research. The EXAONE 3.5 language models are offered in three configurations: 32B, 7.8B, and 2.4B. These models feature several standout capabilities: 1) exceptional instruction following capabilities in real-world scenarios, achieving the highest scores across seven benchmarks, 2) outstanding long-context comprehension, attaining the top performance in four benchmarks, and 3) competitive results compared to state-of-the-art open models of similar sizes across nine general benchmarks. The EXAONE 3.5 language models are open to anyone for research purposes and can be downloaded from https://huggingface.co/LGAI-EXAONE. For commercial use, please reach out to the official contact point of LG AI Research: [email protected].

Summary

AI-Generated Summary

PDF514December 9, 2024