Attention Branch Network: Learning of Attention Mechanism for Visual Explanation

#875

summarized by : Katsuya Shimabukuro

Hiroshi Fukui, Tsubasa Hirakawa, Takayoshi Yamashita, Hironobu Fujiyoshi

どんな論文か？

推論の計算のみで、識別器がどこを見て画像のラベルを識別しているかを判定する Response-Based Visual Explanationのタスクで、CNNの識別精度を低下させず、既存の一般的なモデルや様々なタスクに簡単に応用できるVisual Explanation手法を提案

新規性

特徴抽出器、アテンションブランチ、識別ブランチに分けられれ、ベース手法の特徴抽出器の出力をもとに、アテンションブランチでは、アテンションマップの抽出とクラスラベルの予測、識別ブランチはアテンションマップも使用してクラスラベルの予測を行う

結果

VGGやResNetなどをベースラインとして、CIFAR10やImageNetなどの一般的な画像認識タスクだけでなく、fine-grainedな認識や、Multi-task学習においても、CNNの識別精度を低下させず、CAMやGrad-CAMと遜色ないVisual Explanationを行えることを示した。

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．