ChatPaper.aiChatPaper

Rapport Technique d'EXAONE 4.5

EXAONE 4.5 Technical Report

April 9, 2026
Auteurs: Eunbi Choi, Kibong Choi, Sehyun Chun, Seokhee Hong, Junwon Hwang, Hyojin Jeon, Ahra Jo, Hyunjik Jo, Yeonsik Jo, Joonkee Kim, Seonghwan Kim, Soyeon Kim, Sunkyoung Kim, Yireun Kim, Yongil Kim, Changhun Lee, Haeju Lee, Jinsik Lee, Kyungmin Lee, Sangha Park, Kwangrok Ryoo, Minju Seo, Sejong Yang, Heuiyeen Yeen, Hwan Chang, Stanley Jungkyu Choi, Yejin Choi, Kyubeen Han, Joonwon Jang, Kijeong Jeon, Geunyeong Jeong, Gerrard Jeongwon Jo, Jiyeon Jung, Daeseong Kim, Dohoon Kim, Dohyun Kim, Hyunseo Kim, Minu Kim, Myoungshin Kim, Youchul Kim, Byungoh Ko, Christopher Lee, Edward Hwayoung Lee, Honglak Lee, Jiyoung Lee, Sangeun Lee, Seungwon Lim, Woohyung Lim, Jueun Mun, Jaewoo Park, Jimin Park, Jinho Park, Yongmin Park, Wooseok Seo, Yongwoo Song, Sihyuk Yi, Kyungjae Yoo, Sangyeon Yoon
cs.AI

Résumé

Ce rapport technique présente EXAONE 4.5, le premier modèle de vision et langage à poids libres publié par LG AI Research. EXAONE 4.5 est conçu en intégrant un encodeur visuel dédié dans l'architecture existante d'EXAONE 4.0, permettant un pré-entraînement multimodal natif sur les modalités visuelles et textuelles. Le modèle est entraîné sur des données à grande échelle soigneusement sélectionnées, en mettant particulièrement l'accent sur des corpus centrés sur les documents, en adéquation avec les domaines d'application stratégiques de LG. Cette conception ciblée des données permet des gains de performances substantiels dans la compréhension de documents et les tâches associées, tout en apportant des améliorations généralisées des capacités linguistiques générales. EXAONE 4.5 étend la longueur de contexte jusqu'à 256 000 tokens, facilitant le raisonnement en contexte long et les cas d'usage à l'échelle entreprise. Les évaluations comparatives démontrent qu'EXAONE 4.5 atteint des performances compétitives dans les benchmarks généraux tout en surpassant les modèles de pointe de taille similaire dans la compréhension de documents et le raisonnement contextuel en coréen. Dans le cadre des efforts continus de LG pour un déploiement industriel pratique, EXAONE 4.5 est conçu pour être continuellement étendu à des domaines et scénarios d'application supplémentaires, afin de faire progresser l'IA pour une vie meilleure.
English
This technical report introduces EXAONE 4.5, the first open-weight vision language model released by LG AI Research. EXAONE 4.5 is architected by integrating a dedicated visual encoder into the existing EXAONE 4.0 framework, enabling native multimodal pretraining over both visual and textual modalities. The model is trained on large-scale data with careful curation, particularly emphasizing document-centric corpora that align with LG's strategic application domains. This targeted data design enables substantial performance gains in document understanding and related tasks, while also delivering broad improvements across general language capabilities. EXAONE 4.5 extends context length up to 256K tokens, facilitating long-context reasoning and enterprise-scale use cases. Comparative evaluations demonstrate that EXAONE 4.5 achieves competitive performance in general benchmarks while outperforming state-of-the-art models of similar scale in document understanding and Korean contextual reasoning. As part of LG's ongoing effort toward practical industrial deployment, EXAONE 4.5 is designed to be continuously extended with additional domains and application scenarios to advance AI for a better life.
PDF402April 14, 2026