Hermes 4 技術レポート
Hermes 4 Technical Report
August 25, 2025
著者: Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, Dakota Mahan, Jeffrey Quesnelle, Joe Li, Chen Guang, Shannon Sands, Karan Malhotra
cs.AI
要旨
我々は、構造化されたマルチターン推論と幅広い指示追従能力を組み合わせたハイブリッド推論モデルファミリーであるHermes 4を紹介する。データキュレーション、合成、トレーニング、評価の過程で遭遇した課題を説明し、これらの課題を大規模に対処するために採用した解決策を概説する。数学的推論、コーディング、知識、理解、アライメントのベンチマークにわたって包括的に評価を行い、定量的なパフォーマンスと定性的な行動分析の両方を報告する。オープンリサーチを支援するため、すべてのモデルウェイトをhttps://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728で公開している。
English
We present Hermes 4, a family of hybrid reasoning models that combine
structured, multi-turn reasoning with broad instruction-following ability. We
describe the challenges encountered during data curation, synthesis, training,
and evaluation, and outline the solutions employed to address these challenges
at scale. We comprehensively evaluate across mathematical reasoning, coding,
knowledge, comprehension, and alignment benchmarks, and we report both
quantitative performance and qualitative behavioral analysis. To support open
research, all model weights are published publicly at
https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728