ChatPaper.aiChatPaper

Relatório Técnico do Hermes 3

Hermes 3 Technical Report

August 15, 2024
Autores: Ryan Teknium, Jeffrey Quesnelle, Chen Guang
cs.AI

Resumo

Os modelos ajustados por instruções (ou "conversacionais") tornaram-se a principal forma pela qual a maioria das pessoas interage com grandes modelos de linguagem. Ao contrário dos modelos "base" ou "fundamentais", os modelos ajustados por instruções são otimizados para responder a declarações imperativas. Apresentamos o Hermes 3, um modelo generalista alinhado de forma neutra para instruções e uso de ferramentas, com fortes habilidades de raciocínio e criatividade. Sua maior versão, Hermes 3 405B, alcança um desempenho de ponta entre os modelos de peso aberto em vários benchmarks públicos.
English
Instruct (or "chat") tuned models have become the primary way in which most people interact with large language models. As opposed to "base" or "foundation" models, instruct-tuned models are optimized to respond to imperative statements. We present Hermes 3, a neutrally-aligned generalist instruct and tool use model with strong reasoning and creative abilities. Its largest version, Hermes 3 405B, achieves state of the art performance among open weight models on several public benchmarks.

Summary

AI-Generated Summary

PDF538November 16, 2024