ChatPaper.aiChatPaper

EchoPrime : Un modèle vision-langage informé par une vue multi-vidéo pour l'interprétation complète de l'échocardiographie

EchoPrime: A Multi-Video View-Informed Vision-Language Model for Comprehensive Echocardiography Interpretation

October 13, 2024
Auteurs: Milos Vukadinovic, Xiu Tang, Neal Yuan, Paul Cheng, Debiao Li, Susan Cheng, Bryan He, David Ouyang
cs.AI

Résumé

L'échocardiographie est la modalité d'imagerie cardiaque la plus largement utilisée, capturant des données vidéo par ultrasons pour évaluer la structure et la fonction cardiaques. L'intelligence artificielle (IA) en échocardiographie a le potentiel de rationaliser les tâches manuelles et d'améliorer la reproductibilité et la précision. Cependant, la plupart des modèles d'IA en échocardiographie sont des systèmes à vue unique et à tâche unique qui ne synthétisent pas les informations complémentaires provenant de plusieurs vues capturées lors d'un examen complet, ce qui entraîne des performances et des applications limitées. Pour résoudre ce problème, nous présentons EchoPrime, un modèle fondamental vision-langage basé sur des vidéos, multi-vues et informé par les vues, formé sur plus de 12 millions de paires vidéo-rapport. EchoPrime utilise l'apprentissage contrastif pour former un modèle d'incorporation unifié pour toutes les vues standard dans une étude échocardiographique complète avec la représentation des maladies et diagnostics rares et courants. EchoPrime utilise ensuite la classification des vues et un modèle d'attention anatomique informé par les vues pour pondérer les interprétations spécifiques aux vidéos qui cartographient précisément la relation entre les vues échocardiographiques et les structures anatomiques. Avec une interprétation augmentée par la récupération, EchoPrime intègre les informations de toutes les vidéos échocardiographiques dans une étude complète et réalise une interprétation clinique échocardiographique complète et holistique. Dans des ensembles de données de deux systèmes de santé indépendants, EchoPrime atteint des performances de pointe sur 23 critères divers de forme et de fonction cardiaques, dépassant les performances des approches spécifiques aux tâches et des modèles fondamentaux précédents. Après une évaluation clinique rigoureuse, EchoPrime peut aider les médecins dans l'évaluation préliminaire automatisée de l'échocardiographie complète.
English
Echocardiography is the most widely used cardiac imaging modality, capturing ultrasound video data to assess cardiac structure and function. Artificial intelligence (AI) in echocardiography has the potential to streamline manual tasks and improve reproducibility and precision. However, most echocardiography AI models are single-view, single-task systems that do not synthesize complementary information from multiple views captured during a full exam, and thus lead to limited performance and scope of applications. To address this problem, we introduce EchoPrime, a multi-view, view-informed, video-based vision-language foundation model trained on over 12 million video-report pairs. EchoPrime uses contrastive learning to train a unified embedding model for all standard views in a comprehensive echocardiogram study with representation of both rare and common diseases and diagnoses. EchoPrime then utilizes view-classification and a view-informed anatomic attention model to weight video-specific interpretations that accurately maps the relationship between echocardiographic views and anatomical structures. With retrieval-augmented interpretation, EchoPrime integrates information from all echocardiogram videos in a comprehensive study and performs holistic comprehensive clinical echocardiography interpretation. In datasets from two independent healthcare systems, EchoPrime achieves state-of-the art performance on 23 diverse benchmarks of cardiac form and function, surpassing the performance of both task-specific approaches and prior foundation models. Following rigorous clinical evaluation, EchoPrime can assist physicians in the automated preliminary assessment of comprehensive echocardiography.

Summary

AI-Generated Summary

PDF135November 16, 2024