- …
- …
#875
summarized by : Katsuya Shimabukuro
どんな論文か?
推論の計算のみで、識別器がどこを見て画像のラベルを識別しているかを判定する Response-Based Visual Explanationのタスクで、CNNの識別精度を低下させず、既存の一般的なモデルや様々なタスクに簡単に応用できるVisual Explanation手法を提案
新規性
特徴抽出器、アテンションブランチ、識別ブランチに分けられれ、ベース手法の特徴抽出器の出力をもとに、アテンションブランチでは、アテンションマップの抽出とクラスラベルの予測、識別ブランチはアテンションマップも使用してクラスラベルの予測を行う
結果
VGGやResNetなどをベースラインとして、CIFAR10やImageNetなどの一般的な画像認識タスクだけでなく、fine-grainedな認識や、Multi-task学習においても、CNNの識別精度を低下させず、CAMやGrad-CAMと遜色ないVisual Explanationを行えることを示した。
その他(なぜ通ったか?等)
- …
- …