ChatPaper.aiChatPaper

Technischer Bericht zu Hermes 3

Hermes 3 Technical Report

August 15, 2024
Autoren: Ryan Teknium, Jeffrey Quesnelle, Chen Guang
cs.AI

Zusammenfassung

Instruktionsgesteuerte (oder "Chat") feinabgestimmte Modelle sind zu der primären Methode geworden, mit der die meisten Menschen mit großen Sprachmodellen interagieren. Im Gegensatz zu "Basis" oder "Grundlagen" Modellen sind instruktionsgesteuerte Modelle darauf optimiert, auf imperativische Aussagen zu reagieren. Wir stellen Hermes 3 vor, ein neutral ausgerichtetes Generalisten-Instruktions- und Werkzeugnutzungsmodell mit starken Argumentations- und kreativen Fähigkeiten. Seine größte Version, Hermes 3 405B, erreicht eine Spitzenleistung unter offenen Gewichtsmodellen in mehreren öffentlichen Benchmarks.
English
Instruct (or "chat") tuned models have become the primary way in which most people interact with large language models. As opposed to "base" or "foundation" models, instruct-tuned models are optimized to respond to imperative statements. We present Hermes 3, a neutrally-aligned generalist instruct and tool use model with strong reasoning and creative abilities. Its largest version, Hermes 3 405B, achieves state of the art performance among open weight models on several public benchmarks.

Summary

AI-Generated Summary

PDF538November 16, 2024