#919
summarized by : Masanori YANO
Spatially Attentive Output Layer for Image Classification

どんな論文か?

画像分類で、GAP(Global Average Pooling)はCNNで畳み込んだ特徴空間の位置情報を考慮しないことに着目し、位置関係を分類に反映できるアテンション機構を提案し、正解率の向上を確認した。
placeholder

新規性

CNNで畳み込んだ特徴空間に、空間的なアテンションマップを適用して画像分類を行うレイヤーのSAOLを提案した。また、CutMixした画像の位置関係を活用し、さらにGAPの画像分類とのSelf-Distillaionを行う複合的なLoss関数も提案した。

結果

CIFAR-10/100及びImageNetのデータセットで評価を行い、SAOLに伴い正解率が向上する結果。また、GAPとのSelf-DistillaionによりGAP単体の画像分類の正解率を向上できる結果。

その他(なぜ通ったか?等)

CutMixの位置関係の活用、GAPとのSelf-Distillaionなど、新たな視点からの検討を含めて全体の構成をまとめているため通ったと考えられる。