Uno Studio Comparativo sulla Codifica Automatica di Lettere Mediche con Spiegabilità
A Comparative Study on Automatic Coding of Medical Letters with Explainability
July 18, 2024
Autori: Jamie Glen, Lifeng Han, Paul Rayson, Goran Nenadic
cs.AI
Abstract
Questo studio mira a esplorare l'implementazione di tecniche di Elaborazione del Linguaggio Naturale (NLP) e di apprendimento automatico (ML) per automatizzare la codifica di lettere mediche con spiegabilità visualizzata e configurazioni leggere su computer locali. Attualmente, negli ambienti clinici, la codifica è un processo manuale che prevede l'assegnazione di codici a ciascuna condizione, procedura e farmaco nella documentazione di un paziente (ad esempio, 56265001 malattia cardiaca utilizzando il codice SNOMED CT). Esistono ricerche preliminari sulla codifica automatica in questo campo che utilizzano modelli ML all'avanguardia; tuttavia, a causa della complessità e delle dimensioni dei modelli, il dispiegamento nel mondo reale non è stato raggiunto. Per facilitare ulteriormente la possibilità di pratiche di codifica automatica, esploriamo alcune soluzioni in un ambiente informatico locale; inoltre, esploriamo la funzione di spiegabilità per la trasparenza dei modelli di intelligenza artificiale. Abbiamo utilizzato il database pubblico MIMIC-III e i modelli di rete HAN/HLAN per scopi di previsione dei codici ICD. Abbiamo anche sperimentato la mappatura tra le basi di conoscenza ICD e SNOMED CT. Nei nostri esperimenti, i modelli hanno fornito informazioni utili per il 97,98% dei codici. Il risultato di questa indagine può gettare luce sull'implementazione della codifica clinica automatica nella pratica, ad esempio in contesti ospedalieri, sui computer locali utilizzati dai clinici, pagina del progetto https://github.com/Glenj01/Medical-Coding.
English
This study aims to explore the implementation of Natural Language Processing
(NLP) and machine learning (ML) techniques to automate the coding of medical
letters with visualised explainability and light-weighted local computer
settings. Currently in clinical settings, coding is a manual process that
involves assigning codes to each condition, procedure, and medication in a
patient's paperwork (e.g., 56265001 heart disease using SNOMED CT code). There
are preliminary research on automatic coding in this field using
state-of-the-art ML models; however, due to the complexity and size of the
models, the real-world deployment is not achieved. To further facilitate the
possibility of automatic coding practice, we explore some solutions in a local
computer setting; in addition, we explore the function of explainability for
transparency of AI models. We used the publicly available MIMIC-III database
and the HAN/HLAN network models for ICD code prediction purposes. We also
experimented with the mapping between ICD and SNOMED CT knowledge bases. In our
experiments, the models provided useful information for 97.98\% of codes. The
result of this investigation can shed some light on implementing automatic
clinical coding in practice, such as in hospital settings, on the local
computers used by clinicians , project page
https://github.com/Glenj01/Medical-Coding.