ChatPaper.aiChatPaper

KD-OCT: 臨床グレードの網膜OCT分類のための効率的な知識蒸留

KD-OCT: Efficient Knowledge Distillation for Clinical-Grade Retinal OCT Classification

December 9, 2025
著者: Erfan Nourbakhsh, Nasrin Sanjari, Ali Nourbakhsh
cs.AI

要旨

加齢黄斑変性(AMD)と脈絡膜新生血管(CNV)関連疾患は、世界的に視力障害の主要原因となっており、光干渉断層計(OCT)が早期発見と管理の基盤をなしている。しかし、ConvNeXtV2-Largeのような最先端の深層学習モデルは計算負荷が高く、臨床現場での展開が困難である。そのため、高い診断性能を維持しつつリアルタイム展開を可能とする効率的なモデルの開発が望まれる。本研究では、高性能なConvNeXtV2-Large教師モデル(高度なデータ拡張、確率的重み平均、focal lossにより強化)を、軽量なEfficientNet-B2学生モデルに圧縮する新規知識蒸留フレームワーク「KD-OCT」を提案する。正常、ドルーゼン、CNVの症例分類を目的とし、ソフトな教師知識の伝達とハードな正解ラベル監督をバランスさせる複合損失関数を用いたリアルタイム蒸留を採用する。提案手法の有効性は、Noor Eye Hospital(NEH)データセットを用いた患者単位の交差検証により評価した。実験結果から、KD-OCTは効率性と精度のバランスにおいて、従来のマルチスケールまたは特徴量融合型OCT分類器を上回り、モデルサイズと推論時間を大幅に削減しながら教師モデルに迫る性能を達成した。圧縮にもかかわらず、学生モデルは既存フレームワークの大半を凌駕し、AMDスクリーニングのエッジデバイスへの展開を容易にする。コードはhttps://github.com/erfan-nourbakhsh/KD-OCTで公開されている。
English
Age-related macular degeneration (AMD) and choroidal neovascularization (CNV)-related conditions are leading causes of vision loss worldwide, with optical coherence tomography (OCT) serving as a cornerstone for early detection and management. However, deploying state-of-the-art deep learning models like ConvNeXtV2-Large in clinical settings is hindered by their computational demands. Therefore, it is desirable to develop efficient models that maintain high diagnostic performance while enabling real-time deployment. In this study, a novel knowledge distillation framework, termed KD-OCT, is proposed to compress a high-performance ConvNeXtV2-Large teacher model, enhanced with advanced augmentations, stochastic weight averaging, and focal loss, into a lightweight EfficientNet-B2 student for classifying normal, drusen, and CNV cases. KD-OCT employs real-time distillation with a combined loss balancing soft teacher knowledge transfer and hard ground-truth supervision. The effectiveness of the proposed method is evaluated on the Noor Eye Hospital (NEH) dataset using patient-level cross-validation. Experimental results demonstrate that KD-OCT outperforms comparable multi-scale or feature-fusion OCT classifiers in efficiency- accuracy balance, achieving near-teacher performance with substantial reductions in model size and inference time. Despite the compression, the student model exceeds most existing frameworks, facilitating edge deployment for AMD screening. Code is available at https://github.com/erfan-nourbakhsh/KD- OCT.
PDF02December 17, 2025