Une étude comparative sur le codage automatique des lettres médicales avec explicabilité
A Comparative Study on Automatic Coding of Medical Letters with Explainability
July 18, 2024
Auteurs: Jamie Glen, Lifeng Han, Paul Rayson, Goran Nenadic
cs.AI
Résumé
Cette étude vise à explorer la mise en œuvre des techniques de traitement du langage naturel (NLP) et d'apprentissage automatique (ML) pour automatiser le codage des lettres médicales avec une explicabilité visuelle et des configurations informatiques locales légères. Actuellement, dans les contextes cliniques, le codage est un processus manuel qui consiste à attribuer des codes à chaque condition, procédure et médicament dans les documents d'un patient (par exemple, 56265001 maladie cardiaque en utilisant le code SNOMED CT). Il existe des recherches préliminaires sur le codage automatique dans ce domaine utilisant des modèles ML de pointe ; cependant, en raison de la complexité et de la taille des modèles, le déploiement dans le monde réel n'est pas réalisé. Pour faciliter davantage la possibilité de pratiquer le codage automatique, nous explorons certaines solutions dans un environnement informatique local ; en outre, nous explorons la fonction d'explicabilité pour la transparence des modèles d'IA. Nous avons utilisé la base de données publique MIMIC-III et les modèles de réseau HAN/HLAN à des fins de prédiction de codes CIM. Nous avons également expérimenté la cartographie entre les bases de connaissances CIM et SNOMED CT. Dans nos expériences, les modèles ont fourni des informations utiles pour 97,98 % des codes. Le résultat de cette investigation peut éclairer la mise en œuvre du codage clinique automatique en pratique, par exemple dans les hôpitaux, sur les ordinateurs locaux utilisés par les cliniciens, page du projet https://github.com/Glenj01/Medical-Coding.
English
This study aims to explore the implementation of Natural Language Processing
(NLP) and machine learning (ML) techniques to automate the coding of medical
letters with visualised explainability and light-weighted local computer
settings. Currently in clinical settings, coding is a manual process that
involves assigning codes to each condition, procedure, and medication in a
patient's paperwork (e.g., 56265001 heart disease using SNOMED CT code). There
are preliminary research on automatic coding in this field using
state-of-the-art ML models; however, due to the complexity and size of the
models, the real-world deployment is not achieved. To further facilitate the
possibility of automatic coding practice, we explore some solutions in a local
computer setting; in addition, we explore the function of explainability for
transparency of AI models. We used the publicly available MIMIC-III database
and the HAN/HLAN network models for ICD code prediction purposes. We also
experimented with the mapping between ICD and SNOMED CT knowledge bases. In our
experiments, the models provided useful information for 97.98\% of codes. The
result of this investigation can shed some light on implementing automatic
clinical coding in practice, such as in hospital settings, on the local
computers used by clinicians , project page
https://github.com/Glenj01/Medical-Coding.Summary
AI-Generated Summary