ChatPaper.aiChatPaper

Rapporto Tecnico Hermes 4

Hermes 4 Technical Report

August 25, 2025
Autori: Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, Dakota Mahan, Jeffrey Quesnelle, Joe Li, Chen Guang, Shannon Sands, Karan Malhotra
cs.AI

Abstract

Presentiamo Hermes 4, una famiglia di modelli di ragionamento ibrido che combina un ragionamento strutturato a più turni con un'ampia capacità di seguire istruzioni. Descriviamo le sfide incontrate durante la curatela dei dati, la sintesi, l'addestramento e la valutazione, e delineiamo le soluzioni adottate per affrontare queste sfide su larga scala. Valutiamo in modo completo su benchmark di ragionamento matematico, codifica, conoscenza, comprensione e allineamento, e riportiamo sia le prestazioni quantitative che l'analisi comportamentale qualitativa. Per supportare la ricerca aperta, tutti i pesi dei modelli sono pubblicati pubblicamente su https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728.
English
We present Hermes 4, a family of hybrid reasoning models that combine structured, multi-turn reasoning with broad instruction-following ability. We describe the challenges encountered during data curation, synthesis, training, and evaluation, and outline the solutions employed to address these challenges at scale. We comprehensively evaluate across mathematical reasoning, coding, knowledge, comprehension, and alignment benchmarks, and we report both quantitative performance and qualitative behavioral analysis. To support open research, all model weights are published publicly at https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728
PDF393August 26, 2025