ChatPaper.aiChatPaper

Технический отчет Hermes 3

Hermes 3 Technical Report

August 15, 2024
Авторы: Ryan Teknium, Jeffrey Quesnelle, Chen Guang
cs.AI

Аннотация

Настроенные модели с инструкциями (или "чат") стали основным способом взаимодействия большинства людей с большими языковыми моделями. В отличие от "базовых" или "основных" моделей, настроенные модели с инструкциями оптимизированы для реагирования на повелительные высказывания. Мы представляем Hermes 3, универсальную модель для инструкций и использования инструментов с сильными способностями к рассуждениям и творчеству. Ее самая крупная версия, Hermes 3 405B, достигает современного уровня производительности среди открытых моделей на нескольких общедоступных бенчмарках.
English
Instruct (or "chat") tuned models have become the primary way in which most people interact with large language models. As opposed to "base" or "foundation" models, instruct-tuned models are optimized to respond to imperative statements. We present Hermes 3, a neutrally-aligned generalist instruct and tool use model with strong reasoning and creative abilities. Its largest version, Hermes 3 405B, achieves state of the art performance among open weight models on several public benchmarks.

Summary

AI-Generated Summary

PDF538November 16, 2024