Technischer Bericht zu Hermes 4
Hermes 4 Technical Report
August 25, 2025
papers.authors: Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, Dakota Mahan, Jeffrey Quesnelle, Joe Li, Chen Guang, Shannon Sands, Karan Malhotra
cs.AI
papers.abstract
Wir präsentieren Hermes 4, eine Familie von hybriden Reasoning-Modellen, die strukturiertes, mehrstufiges Reasoning mit breiter Befolgung von Anweisungen kombinieren. Wir beschreiben die Herausforderungen, die während der Datenkuratierung, Synthese, des Trainings und der Evaluierung auftraten, und skizzieren die Lösungen, die eingesetzt wurden, um diese Herausforderungen in großem Maßstab zu bewältigen. Wir evaluieren umfassend in den Bereichen mathematisches Reasoning, Programmieren, Wissen, Verständnis und Alignment-Benchmarks und berichten sowohl über quantitative Leistung als auch qualitative Verhaltensanalysen. Um die offene Forschung zu unterstützen, werden alle Modellgewichte öffentlich unter https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728 veröffentlicht.
English
We present Hermes 4, a family of hybrid reasoning models that combine
structured, multi-turn reasoning with broad instruction-following ability. We
describe the challenges encountered during data curation, synthesis, training,
and evaluation, and outline the solutions employed to address these challenges
at scale. We comprehensively evaluate across mathematical reasoning, coding,
knowledge, comprehension, and alignment benchmarks, and we report both
quantitative performance and qualitative behavioral analysis. To support open
research, all model weights are published publicly at
https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728