Technisch Rapport Hermes 4

Samenvatting

We presenteren Hermes 4, een familie van hybride redeneermodellen die gestructureerd, meerfasig redeneren combineren met brede instructievolgcapaciteit. We beschrijven de uitdagingen die zich voordeden tijdens de datacuratie, synthese, training en evaluatie, en schetsen de oplossingen die op grote schaal zijn ingezet om deze uitdagingen aan te pakken. We evalueren uitgebreid op benchmarks voor wiskundig redeneren, programmeren, kennis, begrip en afstemming, en rapporteren zowel kwantitatieve prestaties als kwalitatieve gedragsanalyses. Om open onderzoek te ondersteunen, zijn alle modelgewichten openbaar gepubliceerd op https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728.

English

We present Hermes 4, a family of hybrid reasoning models that combine structured, multi-turn reasoning with broad instruction-following ability. We describe the challenges encountered during data curation, synthesis, training, and evaluation, and outline the solutions employed to address these challenges at scale. We comprehensively evaluate across mathematical reasoning, coding, knowledge, comprehension, and alignment benchmarks, and we report both quantitative performance and qualitative behavioral analysis. To support open research, all model weights are published publicly at https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728

Technisch Rapport Hermes 4

Hermes 4 Technical Report

Samenvatting

Support