Eine vergleichende Studie zur automatischen Kodierung von medizinischen Briefen mit Erklärbarkeit.
A Comparative Study on Automatic Coding of Medical Letters with Explainability
July 18, 2024
Autoren: Jamie Glen, Lifeng Han, Paul Rayson, Goran Nenadic
cs.AI
Zusammenfassung
Diese Studie zielt darauf ab, die Implementierung von Natural Language Processing (NLP) und Machine Learning (ML) Techniken zur Automatisierung der Codierung von medizinischen Briefen mit visualisierter Erklärbarkeit und leichtgewichtigen lokalen Computer-Einstellungen zu erforschen. Derzeit ist die Codierung in klinischen Umgebungen ein manueller Prozess, bei dem Codes für jeden Zustand, jede Prozedur und jedes Medikament in den Unterlagen eines Patienten zugewiesen werden (z. B. 56265001 Herzerkrankung unter Verwendung des SNOMED CT-Codes). Es gibt Voruntersuchungen zur automatischen Codierung in diesem Bereich unter Verwendung modernster ML-Modelle. Aufgrund der Komplexität und Größe der Modelle wird jedoch die Implementierung in der realen Welt nicht erreicht. Um die Möglichkeit der automatischen Codierungspraxis weiter zu erleichtern, erforschen wir einige Lösungen in einer lokalen Computerumgebung. Darüber hinaus untersuchen wir die Funktion der Erklärbarkeit zur Transparenz von KI-Modellen. Wir verwendeten die öffentlich verfügbare MIMIC-III-Datenbank und die HAN/HLAN-Netzwerkmodelle für die Vorhersage von ICD-Codes. Wir haben auch mit der Zuordnung zwischen ICD- und SNOMED CT-Wissensbasen experimentiert. In unseren Experimenten lieferten die Modelle für 97,98 % der Codes nützliche Informationen. Das Ergebnis dieser Untersuchung kann einige Einblicke in die Implementierung automatischer klinischer Codierung in der Praxis bieten, z. B. in Krankenhauseinstellungen, auf den von Klinikern verwendeten lokalen Computern, Projektseite https://github.com/Glenj01/Medical-Coding.
English
This study aims to explore the implementation of Natural Language Processing
(NLP) and machine learning (ML) techniques to automate the coding of medical
letters with visualised explainability and light-weighted local computer
settings. Currently in clinical settings, coding is a manual process that
involves assigning codes to each condition, procedure, and medication in a
patient's paperwork (e.g., 56265001 heart disease using SNOMED CT code). There
are preliminary research on automatic coding in this field using
state-of-the-art ML models; however, due to the complexity and size of the
models, the real-world deployment is not achieved. To further facilitate the
possibility of automatic coding practice, we explore some solutions in a local
computer setting; in addition, we explore the function of explainability for
transparency of AI models. We used the publicly available MIMIC-III database
and the HAN/HLAN network models for ICD code prediction purposes. We also
experimented with the mapping between ICD and SNOMED CT knowledge bases. In our
experiments, the models provided useful information for 97.98\% of codes. The
result of this investigation can shed some light on implementing automatic
clinical coding in practice, such as in hospital settings, on the local
computers used by clinicians , project page
https://github.com/Glenj01/Medical-Coding.Summary
AI-Generated Summary