Med42-v2: Um Conjunto de Modelos de Linguagem de Aprendizado de Máquina Clínica
Med42-v2: A Suite of Clinical LLMs
August 12, 2024
Autores: Clément Christophe, Praveen K Kanithi, Tathagata Raha, Shadab Khan, Marco AF Pimentel
cs.AI
Resumo
O Med42-v2 introduz um conjunto de modelos de linguagem clínica de grande porte (LLMs) projetados para lidar com as limitações de modelos genéricos em ambientes de saúde. Esses modelos são construídos com base na arquitetura Llama3 e são ajustados usando dados clínicos especializados. Eles passaram por um alinhamento de preferência em múltiplas etapas para responder efetivamente a solicitações naturais. Enquanto os modelos genéricos frequentemente são alinhados com preferências para evitar responder a consultas clínicas como precaução, o Med42-v2 é especificamente treinado para superar essa limitação, permitindo seu uso em ambientes clínicos. Os modelos Med42-v2 demonstram desempenho superior em comparação com os modelos Llama3 originais em configurações de parâmetros de 8B e 70B e o GPT-4 em vários benchmarks médicos. Esses LLMs são desenvolvidos para compreender consultas clínicas, realizar tarefas de raciocínio e fornecer assistência valiosa em ambientes clínicos. Os modelos agora estão disponíveis publicamente em https://huggingface.co/m42-health.
English
Med42-v2 introduces a suite of clinical large language models (LLMs) designed
to address the limitations of generic models in healthcare settings. These
models are built on Llama3 architecture and fine-tuned using specialized
clinical data. They underwent multi-stage preference alignment to effectively
respond to natural prompts. While generic models are often preference-aligned
to avoid answering clinical queries as a precaution, Med42-v2 is specifically
trained to overcome this limitation, enabling its use in clinical settings.
Med42-v2 models demonstrate superior performance compared to the original
Llama3 models in both 8B and 70B parameter configurations and GPT-4 across
various medical benchmarks. These LLMs are developed to understand clinical
queries, perform reasoning tasks, and provide valuable assistance in clinical
environments. The models are now publicly available at
https://huggingface.co/m42-health{https://huggingface.co/m42-health}.Summary
AI-Generated Summary