ChatPaper.aiChatPaper

Med42-v2: Um Conjunto de Modelos de Linguagem de Aprendizado de Máquina Clínica

Med42-v2: A Suite of Clinical LLMs

August 12, 2024
Autores: Clément Christophe, Praveen K Kanithi, Tathagata Raha, Shadab Khan, Marco AF Pimentel
cs.AI

Resumo

O Med42-v2 introduz um conjunto de modelos de linguagem clínica de grande porte (LLMs) projetados para lidar com as limitações de modelos genéricos em ambientes de saúde. Esses modelos são construídos com base na arquitetura Llama3 e são ajustados usando dados clínicos especializados. Eles passaram por um alinhamento de preferência em múltiplas etapas para responder efetivamente a solicitações naturais. Enquanto os modelos genéricos frequentemente são alinhados com preferências para evitar responder a consultas clínicas como precaução, o Med42-v2 é especificamente treinado para superar essa limitação, permitindo seu uso em ambientes clínicos. Os modelos Med42-v2 demonstram desempenho superior em comparação com os modelos Llama3 originais em configurações de parâmetros de 8B e 70B e o GPT-4 em vários benchmarks médicos. Esses LLMs são desenvolvidos para compreender consultas clínicas, realizar tarefas de raciocínio e fornecer assistência valiosa em ambientes clínicos. Os modelos agora estão disponíveis publicamente em https://huggingface.co/m42-health.
English
Med42-v2 introduces a suite of clinical large language models (LLMs) designed to address the limitations of generic models in healthcare settings. These models are built on Llama3 architecture and fine-tuned using specialized clinical data. They underwent multi-stage preference alignment to effectively respond to natural prompts. While generic models are often preference-aligned to avoid answering clinical queries as a precaution, Med42-v2 is specifically trained to overcome this limitation, enabling its use in clinical settings. Med42-v2 models demonstrate superior performance compared to the original Llama3 models in both 8B and 70B parameter configurations and GPT-4 across various medical benchmarks. These LLMs are developed to understand clinical queries, perform reasoning tasks, and provide valuable assistance in clinical environments. The models are now publicly available at https://huggingface.co/m42-health{https://huggingface.co/m42-health}.

Summary

AI-Generated Summary

PDF532November 28, 2024