Med42-v2: Een Suite van Klinische Taalmodellen
Med42-v2: A Suite of Clinical LLMs
August 12, 2024
Auteurs: Clément Christophe, Praveen K Kanithi, Tathagata Raha, Shadab Khan, Marco AF Pimentel
cs.AI
Samenvatting
Med42-v2 introduceert een reeks klinische large language models (LLM's) die zijn ontworpen om de beperkingen van generieke modellen in gezondheidszorgomgevingen aan te pakken. Deze modellen zijn gebouwd op de Llama3-architectuur en verfijnd met gespecialiseerde klinische gegevens. Ze ondergingen een meerfasige voorkeursafstemming om effectief te reageren op natuurlijke prompts. Terwijl generieke modellen vaak voorkeursafgestemd zijn om klinische vragen uit voorzorg niet te beantwoorden, is Med42-v2 specifiek getraind om deze beperking te overwinnen, waardoor het in klinische omgevingen kan worden gebruikt. De Med42-v2-modellen tonen superieure prestaties vergeleken met de originele Llama3-modellen in zowel 8B als 70B parameterconfiguraties en GPT-4 op diverse medische benchmarks. Deze LLM's zijn ontwikkeld om klinische vragen te begrijpen, redeneertaken uit te voeren en waardevolle ondersteuning te bieden in klinische omgevingen. De modellen zijn nu publiekelijk beschikbaar op https://huggingface.co/m42-health{https://huggingface.co/m42-health}.
English
Med42-v2 introduces a suite of clinical large language models (LLMs) designed
to address the limitations of generic models in healthcare settings. These
models are built on Llama3 architecture and fine-tuned using specialized
clinical data. They underwent multi-stage preference alignment to effectively
respond to natural prompts. While generic models are often preference-aligned
to avoid answering clinical queries as a precaution, Med42-v2 is specifically
trained to overcome this limitation, enabling its use in clinical settings.
Med42-v2 models demonstrate superior performance compared to the original
Llama3 models in both 8B and 70B parameter configurations and GPT-4 across
various medical benchmarks. These LLMs are developed to understand clinical
queries, perform reasoning tasks, and provide valuable assistance in clinical
environments. The models are now publicly available at
https://huggingface.co/m42-health{https://huggingface.co/m42-health}.