Технический отчет Hermes 4
Hermes 4 Technical Report
August 25, 2025
Авторы: Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, Dakota Mahan, Jeffrey Quesnelle, Joe Li, Chen Guang, Shannon Sands, Karan Malhotra
cs.AI
Аннотация
Представляем Hermes 4 — семейство гибридных моделей рассуждений, сочетающих структурированное многошаговое мышление с широкими способностями к выполнению инструкций. Мы описываем трудности, с которыми столкнулись в процессе сбора данных, их синтеза, обучения и оценки, а также излагаем решения, применённые для масштабного преодоления этих проблем. Проведено всестороннее тестирование на задачах математического рассуждения, программирования, знаний, понимания и соответствия, с представлением как количественных показателей производительности, так и качественного анализа поведения. В поддержку открытых исследований все веса моделей опубликованы в открытом доступе по адресу https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728.
English
We present Hermes 4, a family of hybrid reasoning models that combine
structured, multi-turn reasoning with broad instruction-following ability. We
describe the challenges encountered during data curation, synthesis, training,
and evaluation, and outline the solutions employed to address these challenges
at scale. We comprehensively evaluate across mathematical reasoning, coding,
knowledge, comprehension, and alignment benchmarks, and we report both
quantitative performance and qualitative behavioral analysis. To support open
research, all model weights are published publicly at
https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728