Технический отчет EXAONE 4.5

Аннотация

Данный технический отчет представляет EXAONE 4.5 — первую модель визуального языка с открытыми весами, выпущенную LG AI Research. Архитектура EXAONE 4.5 построена путем интеграции специализированного визуального энкодера в существующую структуру EXAONE 4.0, что обеспечивает нативную мультимодальную предварительную обучение как на визуальных, так и на текстовых данных. Модель обучалась на тщательно отобранных крупномасштабных данных с особым акцентом на документоориентированные корпуса, соответствующие стратегическим прикладным областям LG. Такая целенаправленная конструкция данных обеспечивает значительное повышение производительности в задачах понимания документов и смежных областях, а также дает широкие улучшения общих языковых способностей. EXAONE 4.5 расширяет длину контекста до 256 тысяч токенов, способствуя рассуждениям в длинном контексте и применению в корпоративных масштабах. Сравнительные оценки демонстрируют, что EXAONE 4.5 достигает конкурентоспособных результатов в общих тестах, одновременно превосходя передовые модели схожего масштаба в понимании документов и корейском контекстном reasoning. В рамках продолжающихся усилий LG по практическому промышленному внедрению, EXAONE 4.5 разработана для непрерывного расширения дополнительными доменами и сценариями применения с целью развития ИИ для улучшения качества жизни.

English

This technical report introduces EXAONE 4.5, the first open-weight vision language model released by LG AI Research. EXAONE 4.5 is architected by integrating a dedicated visual encoder into the existing EXAONE 4.0 framework, enabling native multimodal pretraining over both visual and textual modalities. The model is trained on large-scale data with careful curation, particularly emphasizing document-centric corpora that align with LG's strategic application domains. This targeted data design enables substantial performance gains in document understanding and related tasks, while also delivering broad improvements across general language capabilities. EXAONE 4.5 extends context length up to 256K tokens, facilitating long-context reasoning and enterprise-scale use cases. Comparative evaluations demonstrate that EXAONE 4.5 achieves competitive performance in general benchmarks while outperforming state-of-the-art models of similar scale in document understanding and Korean contextual reasoning. As part of LG's ongoing effort toward practical industrial deployment, EXAONE 4.5 is designed to be continuously extended with additional domains and application scenarios to advance AI for a better life.

Технический отчет EXAONE 4.5

EXAONE 4.5 Technical Report

Аннотация

Support