Um Estudo Comparativo sobre Codificação Automática de Cartas Médicas com Explicabilidade
A Comparative Study on Automatic Coding of Medical Letters with Explainability
July 18, 2024
Autores: Jamie Glen, Lifeng Han, Paul Rayson, Goran Nenadic
cs.AI
Resumo
Este estudo tem como objetivo explorar a implementação de técnicas de Processamento de Linguagem Natural (PLN) e de aprendizado de máquina (AM) para automatizar a codificação de cartas médicas com explicabilidade visual e configurações locais de computador leves. Atualmente, em ambientes clínicos, a codificação é um processo manual que envolve atribuir códigos a cada condição, procedimento e medicamento nos documentos de um paciente (por exemplo, 56265001 doença cardíaca usando o código SNOMED CT). Existem pesquisas preliminares sobre a codificação automática nesse campo usando modelos de AM de última geração; no entanto, devido à complexidade e tamanho dos modelos, a implementação no mundo real não é alcançada. Para facilitar ainda mais a possibilidade da prática de codificação automática, exploramos algumas soluções em um ambiente de computador local; além disso, investigamos a função da explicabilidade para a transparência dos modelos de IA. Utilizamos o banco de dados publicamente disponível MIMIC-III e os modelos de rede HAN/HLAN para fins de previsão de códigos ICD. Também experimentamos o mapeamento entre as bases de conhecimento ICD e SNOMED CT. Em nossos experimentos, os modelos forneceram informações úteis para 97,98% dos códigos. O resultado desta investigação pode lançar alguma luz sobre a implementação da codificação clínica automática na prática, como em ambientes hospitalares, nos computadores locais utilizados pelos clínicos, página do projeto https://github.com/Glenj01/Medical-Coding.
English
This study aims to explore the implementation of Natural Language Processing
(NLP) and machine learning (ML) techniques to automate the coding of medical
letters with visualised explainability and light-weighted local computer
settings. Currently in clinical settings, coding is a manual process that
involves assigning codes to each condition, procedure, and medication in a
patient's paperwork (e.g., 56265001 heart disease using SNOMED CT code). There
are preliminary research on automatic coding in this field using
state-of-the-art ML models; however, due to the complexity and size of the
models, the real-world deployment is not achieved. To further facilitate the
possibility of automatic coding practice, we explore some solutions in a local
computer setting; in addition, we explore the function of explainability for
transparency of AI models. We used the publicly available MIMIC-III database
and the HAN/HLAN network models for ICD code prediction purposes. We also
experimented with the mapping between ICD and SNOMED CT knowledge bases. In our
experiments, the models provided useful information for 97.98\% of codes. The
result of this investigation can shed some light on implementing automatic
clinical coding in practice, such as in hospital settings, on the local
computers used by clinicians , project page
https://github.com/Glenj01/Medical-Coding.