ChatPaper.aiChatPaper

Technisch Rapport Hermes 3

Hermes 3 Technical Report

August 15, 2024
Auteurs: Ryan Teknium, Jeffrey Quesnelle, Chen Guang
cs.AI

Samenvatting

Instruct- (of "chat") afgestemde modellen zijn de primaire manier geworden waarop de meeste mensen interacteren met grote taalmodellen. In tegenstelling tot "basis"- of "fundamentele" modellen, zijn instruct-afgestemde modellen geoptimaliseerd om te reageren op imperatieve uitspraken. Wij presenteren Hermes 3, een neutraal uitgelijnd generalistisch instruct- en gereedschapsgebruiksmodel met sterke redeneer- en creatieve vaardigheden. De grootste versie, Hermes 3 405B, behaalt state-of-the-art prestaties onder open gewichtsmodellen op verschillende publieke benchmarks.
English
Instruct (or "chat") tuned models have become the primary way in which most people interact with large language models. As opposed to "base" or "foundation" models, instruct-tuned models are optimized to respond to imperative statements. We present Hermes 3, a neutrally-aligned generalist instruct and tool use model with strong reasoning and creative abilities. Its largest version, Hermes 3 405B, achieves state of the art performance among open weight models on several public benchmarks.

Summary

AI-Generated Summary

PDF538November 16, 2024