Escalonamento da Correspondência de Ensaios Clínicos Usando Modelos de Linguagem de Grande Escala: Um Estudo de Caso em Oncologia

Resumo

A correspondência de ensaios clínicos é um processo fundamental na prestação de serviços de saúde e na descoberta de tratamentos. Na prática, esse processo é prejudicado pelo excesso de dados não estruturados e pela dependência de processamento manual que não é escalável. Neste artigo, realizamos um estudo sistemático sobre a escalabilidade da correspondência de ensaios clínicos utilizando modelos de linguagem de grande escala (LLMs), com foco na área de oncologia. Nosso estudo é baseado em um sistema de correspondência de ensaios clínicos atualmente em fase de teste em uma grande rede de saúde dos Estados Unidos. Os resultados iniciais são promissores: modelos de ponta, como o GPT-4, já são capazes de estruturar critérios de elegibilidade detalhados de ensaios clínicos e extrair lógicas complexas de correspondência (por exemplo, operadores AND/OR/NOT aninhados). Embora ainda estejam longe da perfeição, os LLMs superam significativamente as abordagens anteriores e podem servir como uma solução preliminar para ajudar a triar candidatos paciente-ensaio com a participação de humanos no processo. Nosso estudo também revela algumas áreas importantes de aprimoramento para a aplicação de LLMs na correspondência de ensaios clínicos de ponta a ponta, como limitações de contexto e precisão, especialmente na estruturação de informações do paciente a partir de registros médicos longitudinais.

English

Clinical trial matching is a key process in health delivery and discovery. In practice, it is plagued by overwhelming unstructured data and unscalable manual processing. In this paper, we conduct a systematic study on scaling clinical trial matching using large language models (LLMs), with oncology as the focus area. Our study is grounded in a clinical trial matching system currently in test deployment at a large U.S. health network. Initial findings are promising: out of box, cutting-edge LLMs, such as GPT-4, can already structure elaborate eligibility criteria of clinical trials and extract complex matching logic (e.g., nested AND/OR/NOT). While still far from perfect, LLMs substantially outperform prior strong baselines and may serve as a preliminary solution to help triage patient-trial candidates with humans in the loop. Our study also reveals a few significant growth areas for applying LLMs to end-to-end clinical trial matching, such as context limitation and accuracy, especially in structuring patient information from longitudinal medical records.

Escalonamento da Correspondência de Ensaios Clínicos Usando Modelos de Linguagem de Grande Escala: Um Estudo de Caso em Oncologia

Scaling Clinical Trial Matching Using Large Language Models: A Case Study in Oncology

Resumo

Support