Rapport Technique Hermes 4
Hermes 4 Technical Report
August 25, 2025
papers.authors: Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, Dakota Mahan, Jeffrey Quesnelle, Joe Li, Chen Guang, Shannon Sands, Karan Malhotra
cs.AI
papers.abstract
Nous présentons Hermes 4, une famille de modèles de raisonnement hybride qui allient un raisonnement structuré et multi-tours à une capacité étendue de suivi d'instructions. Nous décrivons les défis rencontrés lors de la curation des données, de leur synthèse, de l'entraînement et de l'évaluation, et nous exposons les solutions mises en œuvre pour relever ces défis à grande échelle. Nous évaluons de manière exhaustive les performances sur des benchmarks de raisonnement mathématique, de codage, de connaissances, de compréhension et d'alignement, et nous rapportons à la fois des résultats quantitatifs et une analyse qualitative des comportements. Pour soutenir la recherche ouverte, tous les poids des modèles sont publiés publiquement sur https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728.
English
We present Hermes 4, a family of hybrid reasoning models that combine
structured, multi-turn reasoning with broad instruction-following ability. We
describe the challenges encountered during data curation, synthesis, training,
and evaluation, and outline the solutions employed to address these challenges
at scale. We comprehensively evaluate across mathematical reasoning, coding,
knowledge, comprehension, and alignment benchmarks, and we report both
quantitative performance and qualitative behavioral analysis. To support open
research, all model weights are published publicly at
https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728