Rapport Technique Hermes 4

Résumé

Nous présentons Hermes 4, une famille de modèles de raisonnement hybride qui allient un raisonnement structuré et multi-tours à une capacité étendue de suivi d'instructions. Nous décrivons les défis rencontrés lors de la curation des données, de leur synthèse, de l'entraînement et de l'évaluation, et nous exposons les solutions mises en œuvre pour relever ces défis à grande échelle. Nous évaluons de manière exhaustive les performances sur des benchmarks de raisonnement mathématique, de codage, de connaissances, de compréhension et d'alignement, et nous rapportons à la fois des résultats quantitatifs et une analyse qualitative des comportements. Pour soutenir la recherche ouverte, tous les poids des modèles sont publiés publiquement sur https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728.

English

We present Hermes 4, a family of hybrid reasoning models that combine structured, multi-turn reasoning with broad instruction-following ability. We describe the challenges encountered during data curation, synthesis, training, and evaluation, and outline the solutions employed to address these challenges at scale. We comprehensively evaluate across mathematical reasoning, coding, knowledge, comprehension, and alignment benchmarks, and we report both quantitative performance and qualitative behavioral analysis. To support open research, all model weights are published publicly at https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728