ChatPaper.aiChatPaper

Informe Técnico de Hermes 4

Hermes 4 Technical Report

August 25, 2025
Autores: Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, Dakota Mahan, Jeffrey Quesnelle, Joe Li, Chen Guang, Shannon Sands, Karan Malhotra
cs.AI

Resumen

Presentamos Hermes 4, una familia de modelos de razonamiento híbrido que combinan un razonamiento estructurado y multiturno con una amplia capacidad de seguimiento de instrucciones. Describimos los desafíos encontrados durante la curación, síntesis, entrenamiento y evaluación de datos, y delineamos las soluciones empleadas para abordar estos desafíos a gran escala. Evaluamos exhaustivamente en benchmarks de razonamiento matemático, codificación, conocimiento, comprensión y alineación, y reportamos tanto el rendimiento cuantitativo como el análisis cualitativo del comportamiento. Para apoyar la investigación abierta, todos los pesos del modelo se publican públicamente en https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728.
English
We present Hermes 4, a family of hybrid reasoning models that combine structured, multi-turn reasoning with broad instruction-following ability. We describe the challenges encountered during data curation, synthesis, training, and evaluation, and outline the solutions employed to address these challenges at scale. We comprehensively evaluate across mathematical reasoning, coding, knowledge, comprehension, and alignment benchmarks, and we report both quantitative performance and qualitative behavioral analysis. To support open research, all model weights are published publicly at https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728
PDF122August 26, 2025