ChatPaper.aiChatPaper

EHRCon : Jeu de données pour vérifier la cohérence entre les notes non structurées et les tableaux structurés dans les dossiers médicaux électroniques

EHRCon: Dataset for Checking Consistency between Unstructured Notes and Structured Tables in Electronic Health Records

June 24, 2024
Auteurs: Yeonsu Kwon, Jiho Kim, Gyubok Lee, Seongsu Bae, Daeun Kyung, Wonchul Cha, Tom Pollard, Alistair Johnson, Edward Choi
cs.AI

Résumé

Les dossiers médicaux électroniques (DME) sont essentiels pour stocker les dossiers médicaux complets des patients, combinant des données structurées (par exemple, les médicaments) avec des notes cliniques détaillées (par exemple, les notes des médecins). Ces éléments sont cruciaux pour une récupération simple des données et offrent des insights contextuels approfondis sur les soins aux patients. Cependant, ils souffrent souvent de divergences dues à des conceptions de systèmes DME peu intuitives et à des erreurs humaines, posant des risques sérieux pour la sécurité des patients. Pour remédier à cela, nous avons développé EHRCon, un nouveau jeu de données et une tâche spécifiquement conçus pour assurer la cohérence des données entre les tables structurées et les notes non structurées dans les DME. EHRCon a été élaboré en collaboration avec des professionnels de la santé en utilisant le jeu de données DME MIMIC-III, et inclut des annotations manuelles de 3 943 entités à travers 105 notes cliniques vérifiées pour leur cohérence avec les entrées de la base de données. EHRCon existe en deux versions, l'une utilisant le schéma original de MIMIC-III, et l'autre utilisant le schéma OMOP CDM, afin d'augmenter son applicabilité et sa généralisabilité. De plus, en exploitant les capacités des grands modèles de langage, nous introduisons CheckEHR, un nouveau cadre pour vérifier la cohérence entre les notes cliniques et les tables de base de données. CheckEHR utilise un processus en huit étapes et montre des résultats prometteurs dans des configurations few-shot et zero-shot. Le code est disponible à l'adresse https://github.com/dustn1259/EHRCon.
English
Electronic Health Records (EHRs) are integral for storing comprehensive patient medical records, combining structured data (e.g., medications) with detailed clinical notes (e.g., physician notes). These elements are essential for straightforward data retrieval and provide deep, contextual insights into patient care. However, they often suffer from discrepancies due to unintuitive EHR system designs and human errors, posing serious risks to patient safety. To address this, we developed EHRCon, a new dataset and task specifically designed to ensure data consistency between structured tables and unstructured notes in EHRs. EHRCon was crafted in collaboration with healthcare professionals using the MIMIC-III EHR dataset, and includes manual annotations of 3,943 entities across 105 clinical notes checked against database entries for consistency. EHRCon has two versions, one using the original MIMIC-III schema, and another using the OMOP CDM schema, in order to increase its applicability and generalizability. Furthermore, leveraging the capabilities of large language models, we introduce CheckEHR, a novel framework for verifying the consistency between clinical notes and database tables. CheckEHR utilizes an eight-stage process and shows promising results in both few-shot and zero-shot settings. The code is available at https://github.com/dustn1259/EHRCon.

Summary

AI-Generated Summary

PDF137November 29, 2024