ChatPaper.aiChatPaper

Med42-v2: Een Suite van Klinische Taalmodellen

Med42-v2: A Suite of Clinical LLMs

August 12, 2024
Auteurs: Clément Christophe, Praveen K Kanithi, Tathagata Raha, Shadab Khan, Marco AF Pimentel
cs.AI

Samenvatting

Med42-v2 introduceert een reeks klinische large language models (LLM's) die zijn ontworpen om de beperkingen van generieke modellen in gezondheidszorgomgevingen aan te pakken. Deze modellen zijn gebouwd op de Llama3-architectuur en verfijnd met gespecialiseerde klinische gegevens. Ze ondergingen een meerfasige voorkeursafstemming om effectief te reageren op natuurlijke prompts. Terwijl generieke modellen vaak voorkeursafgestemd zijn om klinische vragen uit voorzorg niet te beantwoorden, is Med42-v2 specifiek getraind om deze beperking te overwinnen, waardoor het in klinische omgevingen kan worden gebruikt. De Med42-v2-modellen tonen superieure prestaties vergeleken met de originele Llama3-modellen in zowel 8B als 70B parameterconfiguraties en GPT-4 op diverse medische benchmarks. Deze LLM's zijn ontwikkeld om klinische vragen te begrijpen, redeneertaken uit te voeren en waardevolle ondersteuning te bieden in klinische omgevingen. De modellen zijn nu publiekelijk beschikbaar op https://huggingface.co/m42-health{https://huggingface.co/m42-health}.
English
Med42-v2 introduces a suite of clinical large language models (LLMs) designed to address the limitations of generic models in healthcare settings. These models are built on Llama3 architecture and fine-tuned using specialized clinical data. They underwent multi-stage preference alignment to effectively respond to natural prompts. While generic models are often preference-aligned to avoid answering clinical queries as a precaution, Med42-v2 is specifically trained to overcome this limitation, enabling its use in clinical settings. Med42-v2 models demonstrate superior performance compared to the original Llama3 models in both 8B and 70B parameter configurations and GPT-4 across various medical benchmarks. These LLMs are developed to understand clinical queries, perform reasoning tasks, and provide valuable assistance in clinical environments. The models are now publicly available at https://huggingface.co/m42-health{https://huggingface.co/m42-health}.
PDF522November 28, 2024