Med42-v2: Un conjunto de Modelos de Lenguaje de Aprendizaje Automático Clínico
Med42-v2: A Suite of Clinical LLMs
August 12, 2024
Autores: Clément Christophe, Praveen K Kanithi, Tathagata Raha, Shadab Khan, Marco AF Pimentel
cs.AI
Resumen
Med42-v2 presenta una serie de modelos de lenguaje grandes clínicos (LLMs) diseñados para abordar las limitaciones de los modelos genéricos en entornos de atención médica. Estos modelos se basan en la arquitectura Llama3 y se ajustan finamente utilizando datos clínicos especializados. Se sometieron a un alineamiento de preferencias en múltiples etapas para responder de manera efectiva a las indicaciones naturales. Mientras que los modelos genéricos suelen alinearse con preferencias para evitar responder a consultas clínicas como medida de precaución, Med42-v2 está específicamente entrenado para superar esta limitación, lo que permite su uso en entornos clínicos. Los modelos Med42-v2 muestran un rendimiento superior en comparación con los modelos Llama3 originales en configuraciones de parámetros de 8B y 70B, y GPT-4 en diversos puntos de referencia médicos. Estos LLMs se desarrollaron para comprender consultas clínicas, realizar tareas de razonamiento y proporcionar asistencia valiosa en entornos clínicos. Los modelos ahora están disponibles públicamente en https://huggingface.co/m42-health.
English
Med42-v2 introduces a suite of clinical large language models (LLMs) designed
to address the limitations of generic models in healthcare settings. These
models are built on Llama3 architecture and fine-tuned using specialized
clinical data. They underwent multi-stage preference alignment to effectively
respond to natural prompts. While generic models are often preference-aligned
to avoid answering clinical queries as a precaution, Med42-v2 is specifically
trained to overcome this limitation, enabling its use in clinical settings.
Med42-v2 models demonstrate superior performance compared to the original
Llama3 models in both 8B and 70B parameter configurations and GPT-4 across
various medical benchmarks. These LLMs are developed to understand clinical
queries, perform reasoning tasks, and provide valuable assistance in clinical
environments. The models are now publicly available at
https://huggingface.co/m42-health{https://huggingface.co/m42-health}.Summary
AI-Generated Summary