ChatPaper.aiChatPaper

Relatório Técnico do Hermes 4

Hermes 4 Technical Report

August 25, 2025
Autores: Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, Dakota Mahan, Jeffrey Quesnelle, Joe Li, Chen Guang, Shannon Sands, Karan Malhotra
cs.AI

Resumo

Apresentamos o Hermes 4, uma família de modelos de raciocínio híbrido que combinam raciocínio estruturado e multi-turn com ampla capacidade de seguir instruções. Descrevemos os desafios encontrados durante a curadoria, síntese, treinamento e avaliação de dados, e delineamos as soluções empregadas para abordar esses desafios em escala. Avaliamos de forma abrangente em benchmarks de raciocínio matemático, codificação, conhecimento, compreensão e alinhamento, e relatamos tanto o desempenho quantitativo quanto a análise comportamental qualitativa. Para apoiar a pesquisa aberta, todos os pesos dos modelos são publicados publicamente em https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728.
English
We present Hermes 4, a family of hybrid reasoning models that combine structured, multi-turn reasoning with broad instruction-following ability. We describe the challenges encountered during data curation, synthesis, training, and evaluation, and outline the solutions employed to address these challenges at scale. We comprehensively evaluate across mathematical reasoning, coding, knowledge, comprehension, and alignment benchmarks, and we report both quantitative performance and qualitative behavioral analysis. To support open research, all model weights are published publicly at https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728
PDF353August 26, 2025