ChatPaper.aiChatPaper

Med42-v2: Набор клинических моделей глубокого обучения.

Med42-v2: A Suite of Clinical LLMs

August 12, 2024
Авторы: Clément Christophe, Praveen K Kanithi, Tathagata Raha, Shadab Khan, Marco AF Pimentel
cs.AI

Аннотация

Med42-v2 представляет собой набор клинических больших языковых моделей (LLM), разработанных для преодоления ограничений общих моделей в области здравоохранения. Эти модели построены на архитектуре Llama3 и донастроены с использованием специализированных клинических данных. Они прошли многоэтапную настройку предпочтений для эффективного реагирования на естественные запросы. В то время как общие модели часто настраиваются на предпочтения, чтобы избегать ответов на клинические запросы в качестве предосторожности, Med42-v2 специально обучен преодолевать это ограничение, что позволяет его использование в клинических условиях. Модели Med42-v2 демонстрируют превосходную производительность по сравнению с оригинальными моделями Llama3 как в конфигурациях параметров 8B и 70B, так и с GPT-4 на различных медицинских бенчмарках. Эти LLM разработаны для понимания клинических запросов, выполнения задач рассуждения и предоставления ценной помощи в клинических средах. Модели теперь доступны публично по адресу https://huggingface.co/m42-health.
English
Med42-v2 introduces a suite of clinical large language models (LLMs) designed to address the limitations of generic models in healthcare settings. These models are built on Llama3 architecture and fine-tuned using specialized clinical data. They underwent multi-stage preference alignment to effectively respond to natural prompts. While generic models are often preference-aligned to avoid answering clinical queries as a precaution, Med42-v2 is specifically trained to overcome this limitation, enabling its use in clinical settings. Med42-v2 models demonstrate superior performance compared to the original Llama3 models in both 8B and 70B parameter configurations and GPT-4 across various medical benchmarks. These LLMs are developed to understand clinical queries, perform reasoning tasks, and provide valuable assistance in clinical environments. The models are now publicly available at https://huggingface.co/m42-health{https://huggingface.co/m42-health}.

Summary

AI-Generated Summary

PDF532November 28, 2024