ChatPaper.aiChatPaper

Informe Técnico de Hermes 3

Hermes 3 Technical Report

August 15, 2024
Autores: Ryan Teknium, Jeffrey Quesnelle, Chen Guang
cs.AI

Resumen

Los modelos ajustados mediante instrucciones (o "conversacionales") se han convertido en la forma principal en la que la mayoría de las personas interactúan con grandes modelos de lenguaje. A diferencia de los modelos "base" o "fundamentales", los modelos ajustados mediante instrucciones están optimizados para responder a declaraciones imperativas. Presentamos Hermes 3, un modelo generalista alineado de manera neutral para instrucciones y uso de herramientas, con sólidas habilidades de razonamiento y creatividad. Su versión más grande, Hermes 3 405B, logra un rendimiento de vanguardia entre los modelos de peso abierto en varios benchmarks públicos.
English
Instruct (or "chat") tuned models have become the primary way in which most people interact with large language models. As opposed to "base" or "foundation" models, instruct-tuned models are optimized to respond to imperative statements. We present Hermes 3, a neutrally-aligned generalist instruct and tool use model with strong reasoning and creative abilities. Its largest version, Hermes 3 405B, achieves state of the art performance among open weight models on several public benchmarks.

Summary

AI-Generated Summary

PDF538November 16, 2024