- …
- …
#398
summarized by : Ryo Nakamura
どんな論文か?
本研究では高性能な弱教師ありオブジェクトローカライゼーション(WSOL)を実現するために,浅いクラスアクティベーションマップ(CAM)と深いCAMを掛け合わせたCAMを生成しし,背景をノイズをフィルタリングすることで物体の境界を強調した手法について提案している.浅い層のCAMは背景領域が含まれており,WSOLで使用されることはなかったのだが,浅い層のCAMについて分析しその重要性を主張した.
新規性
浅い層のCAMを最大限に活用するためのSPOLモデルを提案した点.
WSOLにおいて,良いオブジェクトマスクを得るためにGaussian prior pseudo label(GPPL)とClass agnostc segmentationモデルを提案した点.
その結果,CUB-200とImageNet-1Kの両方のベンチマークにおいて,従来の手法を大幅に上回る結果を得ることができた点.
結果
CUB-200とImageNet-1Kの両方のベンチマークにおいて,それぞれ93.44%と67.15%(すなわち、3.93%と2.13%の改善)のトップ5局所化精度を達成し,SoTAを超えることが確認された.また,Ablation Studyとしてどの層の特徴が重要かを分析し,最終的に全ての特徴を掛け合わせてMaskを生成した方が性能が良かった.
その他(なぜ通ったか?等)
動機と実装が非常にわかりやすく,そのAblation Studyも充実しているだけでなく,SoTAを超えたことが採択された要因であると考える.
- …
- …