Настраиваемое извлечение клинической информации с помощью агентного RAG: что работает, что ломается и почему

Аннотация

Контексты пациентов охватывают сотни разнородных документов и тысячи структурированных точек данных, однако метаданные на уровне документов, необходимые системам ИИ для поиска и сортировки, отсутствуют или являются неполными. Стандартная генерация с расширенным поиском (RAG) не справляется с этими данными, неправильно обрабатывая временные рассуждения, междокументные зависимости и отсутствующие метаданные. Мы развёртываем ACIE (Агентное клиническое извлечение информации) в Университетской клинике Эссена: локальный агентный конвейер RAG, который анализирует полные контексты пациентов и подкрепляет каждый ответ исходными фрагментами для проверки врачом. Мы количественно оцениваем разрыв в метаданных, прослеживаем архитектурные решения, сформированные этим разрывом, и оцениваем извлечение данных наряду с независимым ретроспективным исследованием регистра лимфомы, в котором врачи ядерной медицины проверяют каждое извлечённое значение на соответствие указанным источникам. На 7 326 оценках врачи приняли 96,5% извлечений, причём приемлемость по типам варьировалась от 80% до 99%.

English

Patient contexts span hundreds of heterogeneous documents and thousands of structured data points, yet the document-level metadata that AI systems need for retrieval and triage is absent or incomplete. Standard retrieval-augmented generation fails on this data, mishandling temporal reasoning, cross-document dependencies, and missing metadata. We deploy ACIE (Agentic Clinical Information Extraction) at University Medicine Essen: an on-premise agentic RAG pipeline that reasons over complete patient contexts and grounds every answer in source passages for clinician verification. We quantify the metadata gap, trace the architectural decisions it shaped, and evaluate extraction alongside an independent retrospective lymphoma registry study, in which nuclear-medicine physicians verify every extracted value against its cited sources. Across 7,326 judgments, clinicians accepted 96.5\% of extractions, with per-type acceptance ranging from 80\% to 99\%.