Сравнительное исследование автоматического кодирования медицинских писем с возможностью объяснения
A Comparative Study on Automatic Coding of Medical Letters with Explainability
July 18, 2024
Авторы: Jamie Glen, Lifeng Han, Paul Rayson, Goran Nenadic
cs.AI
Аннотация
Данное исследование направлено на изучение применения техник обработки естественного языка (Natural Language Processing, NLP) и машинного обучения (Machine Learning, ML) для автоматизации кодирования медицинских писем с визуализированным объяснением и легковесными локальными настройками компьютера. В настоящее время в клинической практике кодирование является ручным процессом, который включает в себя присвоение кодов каждому состоянию, процедуре и лекарству в документах пациента (например, 56265001 сердечное заболевание с использованием кода SNOMED CT). Существуют предварительные исследования по автоматическому кодированию в этой области с использованием передовых моделей ML; однако из-за сложности и размера моделей реальное внедрение не достигнуто. Для дальнейшего облегчения возможности практики автоматического кодирования мы исследуем некоторые решения на локальном компьютере; кроме того, мы изучаем функцию объяснимости для прозрачности моделей искусственного интеллекта. Мы использовали общедоступную базу данных MIMIC-III и сетевые модели HAN/HLAN для целей предсказания кодов ICD. Мы также экспериментировали с сопоставлением между базами знаний ICD и SNOMED CT. В наших экспериментах модели предоставили полезную информацию для 97,98\% кодов. Результаты данного исследования могут пролить свет на внедрение автоматического клинического кодирования на практике, например, в больничных условиях, на локальных компьютерах, используемых медицинским персоналом, страница проекта https://github.com/Glenj01/Medical-Coding.
English
This study aims to explore the implementation of Natural Language Processing
(NLP) and machine learning (ML) techniques to automate the coding of medical
letters with visualised explainability and light-weighted local computer
settings. Currently in clinical settings, coding is a manual process that
involves assigning codes to each condition, procedure, and medication in a
patient's paperwork (e.g., 56265001 heart disease using SNOMED CT code). There
are preliminary research on automatic coding in this field using
state-of-the-art ML models; however, due to the complexity and size of the
models, the real-world deployment is not achieved. To further facilitate the
possibility of automatic coding practice, we explore some solutions in a local
computer setting; in addition, we explore the function of explainability for
transparency of AI models. We used the publicly available MIMIC-III database
and the HAN/HLAN network models for ICD code prediction purposes. We also
experimented with the mapping between ICD and SNOMED CT knowledge bases. In our
experiments, the models provided useful information for 97.98\% of codes. The
result of this investigation can shed some light on implementing automatic
clinical coding in practice, such as in hospital settings, on the local
computers used by clinicians , project page
https://github.com/Glenj01/Medical-Coding.Summary
AI-Generated Summary