ChatPaper.aiChatPaper

Rapporto Tecnico Hermes 3

Hermes 3 Technical Report

August 15, 2024
Autori: Ryan Teknium, Jeffrey Quesnelle, Chen Guang
cs.AI

Abstract

I modelli ottimizzati per istruzioni (o "chat") sono diventati il principale modo in cui la maggior parte delle persone interagisce con i grandi modelli linguistici. A differenza dei modelli "base" o "fondamentali", i modelli ottimizzati per istruzioni sono progettati per rispondere a comandi imperativi. Presentiamo Hermes 3, un modello generalista allineato in modo neutrale per istruzioni e utilizzo di strumenti, dotato di forti capacità di ragionamento e creatività. La sua versione più grande, Hermes 3 405B, raggiunge prestazioni all'avanguardia tra i modelli open weight su diversi benchmark pubblici.
English
Instruct (or "chat") tuned models have become the primary way in which most people interact with large language models. As opposed to "base" or "foundation" models, instruct-tuned models are optimized to respond to imperative statements. We present Hermes 3, a neutrally-aligned generalist instruct and tool use model with strong reasoning and creative abilities. Its largest version, Hermes 3 405B, achieves state of the art performance among open weight models on several public benchmarks.
PDF558November 16, 2024