Technischer Bericht zu Hermes 4

Zusammenfassung

Wir präsentieren Hermes 4, eine Familie von hybriden Reasoning-Modellen, die strukturiertes, mehrstufiges Reasoning mit breiter Befolgung von Anweisungen kombinieren. Wir beschreiben die Herausforderungen, die während der Datenkuratierung, Synthese, des Trainings und der Evaluierung auftraten, und skizzieren die Lösungen, die eingesetzt wurden, um diese Herausforderungen in großem Maßstab zu bewältigen. Wir evaluieren umfassend in den Bereichen mathematisches Reasoning, Programmieren, Wissen, Verständnis und Alignment-Benchmarks und berichten sowohl über quantitative Leistung als auch qualitative Verhaltensanalysen. Um die offene Forschung zu unterstützen, werden alle Modellgewichte öffentlich unter https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728 veröffentlicht.

English

We present Hermes 4, a family of hybrid reasoning models that combine structured, multi-turn reasoning with broad instruction-following ability. We describe the challenges encountered during data curation, synthesis, training, and evaluation, and outline the solutions employed to address these challenges at scale. We comprehensively evaluate across mathematical reasoning, coding, knowledge, comprehension, and alignment benchmarks, and we report both quantitative performance and qualitative behavioral analysis. To support open research, all model weights are published publicly at https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728