ChatPaper.aiChatPaper

Med42-v2: Un conjunto de Modelos de Lenguaje de Aprendizaje Automático Clínico

Med42-v2: A Suite of Clinical LLMs

August 12, 2024
Autores: Clément Christophe, Praveen K Kanithi, Tathagata Raha, Shadab Khan, Marco AF Pimentel
cs.AI

Resumen

Med42-v2 presenta una serie de modelos de lenguaje grandes clínicos (LLMs) diseñados para abordar las limitaciones de los modelos genéricos en entornos de atención médica. Estos modelos se basan en la arquitectura Llama3 y se ajustan finamente utilizando datos clínicos especializados. Se sometieron a un alineamiento de preferencias en múltiples etapas para responder de manera efectiva a las indicaciones naturales. Mientras que los modelos genéricos suelen alinearse con preferencias para evitar responder a consultas clínicas como medida de precaución, Med42-v2 está específicamente entrenado para superar esta limitación, lo que permite su uso en entornos clínicos. Los modelos Med42-v2 muestran un rendimiento superior en comparación con los modelos Llama3 originales en configuraciones de parámetros de 8B y 70B, y GPT-4 en diversos puntos de referencia médicos. Estos LLMs se desarrollaron para comprender consultas clínicas, realizar tareas de razonamiento y proporcionar asistencia valiosa en entornos clínicos. Los modelos ahora están disponibles públicamente en https://huggingface.co/m42-health.
English
Med42-v2 introduces a suite of clinical large language models (LLMs) designed to address the limitations of generic models in healthcare settings. These models are built on Llama3 architecture and fine-tuned using specialized clinical data. They underwent multi-stage preference alignment to effectively respond to natural prompts. While generic models are often preference-aligned to avoid answering clinical queries as a precaution, Med42-v2 is specifically trained to overcome this limitation, enabling its use in clinical settings. Med42-v2 models demonstrate superior performance compared to the original Llama3 models in both 8B and 70B parameter configurations and GPT-4 across various medical benchmarks. These LLMs are developed to understand clinical queries, perform reasoning tasks, and provide valuable assistance in clinical environments. The models are now publicly available at https://huggingface.co/m42-health{https://huggingface.co/m42-health}.

Summary

AI-Generated Summary

PDF532November 28, 2024