Relatório Técnico do Hermes 4
Hermes 4 Technical Report
August 25, 2025
Autores: Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, Dakota Mahan, Jeffrey Quesnelle, Joe Li, Chen Guang, Shannon Sands, Karan Malhotra
cs.AI
Resumo
Apresentamos o Hermes 4, uma família de modelos de raciocínio híbrido que combinam raciocínio estruturado e multi-turn com ampla capacidade de seguir instruções. Descrevemos os desafios encontrados durante a curadoria, síntese, treinamento e avaliação de dados, e delineamos as soluções empregadas para abordar esses desafios em escala. Avaliamos de forma abrangente em benchmarks de raciocínio matemático, codificação, conhecimento, compreensão e alinhamento, e relatamos tanto o desempenho quantitativo quanto a análise comportamental qualitativa. Para apoiar a pesquisa aberta, todos os pesos dos modelos são publicados publicamente em https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728.
English
We present Hermes 4, a family of hybrid reasoning models that combine
structured, multi-turn reasoning with broad instruction-following ability. We
describe the challenges encountered during data curation, synthesis, training,
and evaluation, and outline the solutions employed to address these challenges
at scale. We comprehensively evaluate across mathematical reasoning, coding,
knowledge, comprehension, and alignment benchmarks, and we report both
quantitative performance and qualitative behavioral analysis. To support open
research, all model weights are published publicly at
https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728