ChatPaper.aiChatPaper

Med42-v2: Una Suite di Modelli Linguistici Clinici

Med42-v2: A Suite of Clinical LLMs

August 12, 2024
Autori: Clément Christophe, Praveen K Kanithi, Tathagata Raha, Shadab Khan, Marco AF Pimentel
cs.AI

Abstract

Med42-v2 introduce una suite di modelli linguistici di grandi dimensioni (LLM) clinici progettati per affrontare i limiti dei modelli generici in contesti sanitari. Questi modelli sono basati sull'architettura Llama3 e ottimizzati utilizzando dati clinici specializzati. Hanno subito un allineamento delle preferenze in più fasi per rispondere efficacemente a prompt naturali. Mentre i modelli generici sono spesso allineati per evitare di rispondere a query cliniche come precauzione, Med42-v2 è specificamente addestrato per superare questa limitazione, consentendone l'uso in ambienti clinici. I modelli Med42-v2 dimostrano prestazioni superiori rispetto ai modelli Llama3 originali sia nelle configurazioni da 8B che da 70B parametri e rispetto a GPT-4 in vari benchmark medici. Questi LLM sono sviluppati per comprendere query cliniche, eseguire compiti di ragionamento e fornire un'assistenza preziosa in contesti clinici. I modelli sono ora disponibili pubblicamente all'indirizzo https://huggingface.co/m42-health{https://huggingface.co/m42-health}.
English
Med42-v2 introduces a suite of clinical large language models (LLMs) designed to address the limitations of generic models in healthcare settings. These models are built on Llama3 architecture and fine-tuned using specialized clinical data. They underwent multi-stage preference alignment to effectively respond to natural prompts. While generic models are often preference-aligned to avoid answering clinical queries as a precaution, Med42-v2 is specifically trained to overcome this limitation, enabling its use in clinical settings. Med42-v2 models demonstrate superior performance compared to the original Llama3 models in both 8B and 70B parameter configurations and GPT-4 across various medical benchmarks. These LLMs are developed to understand clinical queries, perform reasoning tasks, and provide valuable assistance in clinical environments. The models are now publicly available at https://huggingface.co/m42-health{https://huggingface.co/m42-health}.
PDF522November 28, 2024