ChatPaper.aiChatPaper

EchoPrime: 医用超音波心エコー画像を包括的に解釈するためのマルチビデオビュー情報を考慮したビジョン言語モデル

EchoPrime: A Multi-Video View-Informed Vision-Language Model for Comprehensive Echocardiography Interpretation

October 13, 2024
著者: Milos Vukadinovic, Xiu Tang, Neal Yuan, Paul Cheng, Debiao Li, Susan Cheng, Bryan He, David Ouyang
cs.AI

要旨

心エコー検査は、心臓の構造と機能を評価するために超音波ビデオデータを取得する、最も広く使用されている心臓画像診断法です。心エコー検査における人工知能(AI)は、手作業のタスクを効率化し、再現性と精度を向上させる潜在能力を持っています。しかし、ほとんどの心エコー検査AIモデルは、フル検査中にキャプチャされた複数のビューからの補完情報を統合しない単一ビュー、単一タスクのシステムであり、そのため性能と応用範囲が限定されています。この問題に対処するために、私たちはEchoPrimeを導入します。これは、1,200万以上のビデオレポートペアでトレーニングされたマルチビュー、ビュー情報を考慮に入れた、ビデオベースのビジョン言語基盤モデルです。EchoPrimeは、全体的な心エコー検査でのすべての標準ビューのための統一された埋め込みモデルを訓練するために対比学習を使用し、希少および一般的な疾患や診断の表現を行います。その後、EchoPrimeはビュー分類とビュー情報を考慮に入れた解剖学的注意モデルを利用して、心エコー画像のビューと解剖学的構造の関係を正確にマッピングするためにビデオ固有の解釈に重みを付けます。リトリーバル増強解釈を用いて、EchoPrimeは包括的な研究でのすべての心エコー検査ビデオからの情報を統合し、包括的な臨床心エコー検査解釈を行います。2つの独立した医療システムのデータセットでは、EchoPrimeは心臓の形態と機能の23の異なるベンチマークで最先端のパフォーマンスを達成し、タスク固有のアプローチや以前の基盤モデルのパフォーマンスを上回ります。厳格な臨床評価に続いて、EchoPrimeは包括的な心エコー検査の自動初期評価において医師を支援することができます。
English
Echocardiography is the most widely used cardiac imaging modality, capturing ultrasound video data to assess cardiac structure and function. Artificial intelligence (AI) in echocardiography has the potential to streamline manual tasks and improve reproducibility and precision. However, most echocardiography AI models are single-view, single-task systems that do not synthesize complementary information from multiple views captured during a full exam, and thus lead to limited performance and scope of applications. To address this problem, we introduce EchoPrime, a multi-view, view-informed, video-based vision-language foundation model trained on over 12 million video-report pairs. EchoPrime uses contrastive learning to train a unified embedding model for all standard views in a comprehensive echocardiogram study with representation of both rare and common diseases and diagnoses. EchoPrime then utilizes view-classification and a view-informed anatomic attention model to weight video-specific interpretations that accurately maps the relationship between echocardiographic views and anatomical structures. With retrieval-augmented interpretation, EchoPrime integrates information from all echocardiogram videos in a comprehensive study and performs holistic comprehensive clinical echocardiography interpretation. In datasets from two independent healthcare systems, EchoPrime achieves state-of-the art performance on 23 diverse benchmarks of cardiac form and function, surpassing the performance of both task-specific approaches and prior foundation models. Following rigorous clinical evaluation, EchoPrime can assist physicians in the automated preliminary assessment of comprehensive echocardiography.

Summary

AI-Generated Summary

PDF135November 16, 2024