Informe Técnico de Hermes 4

Resumen

Presentamos Hermes 4, una familia de modelos de razonamiento híbrido que combinan un razonamiento estructurado y multiturno con una amplia capacidad de seguimiento de instrucciones. Describimos los desafíos encontrados durante la curación, síntesis, entrenamiento y evaluación de datos, y delineamos las soluciones empleadas para abordar estos desafíos a gran escala. Evaluamos exhaustivamente en benchmarks de razonamiento matemático, codificación, conocimiento, comprensión y alineación, y reportamos tanto el rendimiento cuantitativo como el análisis cualitativo del comportamiento. Para apoyar la investigación abierta, todos los pesos del modelo se publican públicamente en https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728.

English

We present Hermes 4, a family of hybrid reasoning models that combine structured, multi-turn reasoning with broad instruction-following ability. We describe the challenges encountered during data curation, synthesis, training, and evaluation, and outline the solutions employed to address these challenges at scale. We comprehensively evaluate across mathematical reasoning, coding, knowledge, comprehension, and alignment benchmarks, and we report both quantitative performance and qualitative behavioral analysis. To support open research, all model weights are published publicly at https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728