- …
- …
#154
summarized by : Shingo Nakazawa
どんな論文か?
血管形成術はX 線透視下でバルーンやステントなどのデバイスを操作する必要がある。しかしX線照射量の制限から画像はノイジーであり、デバイス位置の適切な認識が難しかった。本論文はデバイス位置追跡のためのエンドツーエンド深層学習フレームワークを提案。臨床の要求に耐えうる高速な推論速度を満たしつつ、最先端のポイントベースのトラッキングモデルと比較して優れた性能を達成したと報告。
新規性
3段階の階層的なフレームワークを提案。1. U-netによるバルーンマーカー検出 2. ResNetによるステントの検出&特徴抽出 (= 局所ランドマーク検出とステントの特徴の検出の両方を利用) 3. Graph CNNによる複数フレーム間のマーカー対応付け (= 時空間的な関連付け)。特に偽陽性を抑制するように学習させることで、限られたデータセットでの学習でも高い検出力を得ることに成功した。
結果
提案モデルを座標回帰モデル (ResNet V2, MobileNet V2) やマルチオブジェクトトラッキングモデル ( MobileNet V2, DLA34) と比較。ステント検出のPrecision, F1, Accuracyは圧倒的で、RecallもSOTAに匹敵。ピクセルレベルでの位置追跡もSOTAレベルの性能 (Table 1)。U-netの改良でさらに精度を上げられると主張。
その他(なぜ通ったか?等)
医用画像に対する取り組み共通の課題として「データセットの少なさ」「臨床で求められる精度の高さ」「(手術で使う場合は)推論速度」があり、この全てを解決しうる手法を示している点でインパクトが大きい。特に今回対象となっている手術はこれまで深層学習がほとんど(現実的な精度で)適用されてこなかった領域の模様。
- …
- …