Een Vergelijkende Studie over Automatische Codering van Medische Brieven met Uitlegbaarheid
A Comparative Study on Automatic Coding of Medical Letters with Explainability
July 18, 2024
Auteurs: Jamie Glen, Lifeng Han, Paul Rayson, Goran Nenadic
cs.AI
Samenvatting
Dit onderzoek heeft als doel de implementatie van Natural Language Processing (NLP) en machine learning (ML) technieken te verkennen om het coderen van medische brieven te automatiseren met gevisualiseerde verklaarbaarheid en lichtgewicht lokale computerinstellingen. Momenteel is codering in klinische omgevingen een handmatig proces waarbij codes worden toegewezen aan elke aandoening, procedure en medicatie in de documentatie van een patiënt (bijvoorbeeld 56265001 hartziekte met behulp van de SNOMED CT-code). Er is voorlopig onderzoek gedaan naar automatische codering in dit veld met behulp van state-of-the-art ML-modellen; echter, vanwege de complexiteit en omvang van de modellen, is de implementatie in de praktijk nog niet gerealiseerd. Om de mogelijkheid van automatische codering verder te vergemakkelijken, verkennen we enkele oplossingen in een lokale computeromgeving; daarnaast onderzoeken we de functie van verklaarbaarheid voor de transparantie van AI-modellen. We gebruikten de openbaar beschikbare MIMIC-III-database en de HAN/HLAN-netwerkmodellen voor ICD-codevoorspellingsdoeleinden. We experimenteerden ook met de mapping tussen ICD- en SNOMED CT-kennisbanken. In onze experimenten boden de modellen nuttige informatie voor 97,98% van de codes. Het resultaat van dit onderzoek kan inzicht bieden in de implementatie van automatische klinische codering in de praktijk, zoals in ziekenhuisomgevingen, op de lokale computers die door clinici worden gebruikt, projectpagina https://github.com/Glenj01/Medical-Coding.
English
This study aims to explore the implementation of Natural Language Processing
(NLP) and machine learning (ML) techniques to automate the coding of medical
letters with visualised explainability and light-weighted local computer
settings. Currently in clinical settings, coding is a manual process that
involves assigning codes to each condition, procedure, and medication in a
patient's paperwork (e.g., 56265001 heart disease using SNOMED CT code). There
are preliminary research on automatic coding in this field using
state-of-the-art ML models; however, due to the complexity and size of the
models, the real-world deployment is not achieved. To further facilitate the
possibility of automatic coding practice, we explore some solutions in a local
computer setting; in addition, we explore the function of explainability for
transparency of AI models. We used the publicly available MIMIC-III database
and the HAN/HLAN network models for ICD code prediction purposes. We also
experimented with the mapping between ICD and SNOMED CT knowledge bases. In our
experiments, the models provided useful information for 97.98\% of codes. The
result of this investigation can shed some light on implementing automatic
clinical coding in practice, such as in hospital settings, on the local
computers used by clinicians , project page
https://github.com/Glenj01/Medical-Coding.