#539
summarized by : 岡本大和
A Shared Multi-Attention Framework for Multi-Label Zero-Shot Learning

どんな論文か?

Zero-Shot Learningの研究。Attentionを複数用いる提案手法によって従来研究の課題点の多くを克服。Multi-Labelを扱える、dominant-labelだけでなく小領域にも注目できる、概念的なlabelも扱える、bboxなしにlocalization機能の獲得、計算コストが膨大でないといったことを達成した。
placeholder

新規性

主な新規性はshare-attentionという発想とそれを学習するための損失関数設計。 Attention featureのうち最大値となる予測値を採用する、Attentionがそれぞれ類似しないようコサイン距離による損失関数を導入、予測と関連する領域のAttentionが際立つような損失関数によってbboxのGTなしでLocalization機能を学習、といった工夫が導入されている。

結果

NUS-WIDE、Large scale Open Image datasetにおいてSoTA達成。ハイパラ調整に依存していないことの確認や、ablation studyもなされている。Localizationにおいても従来よりも高性能を達成した。

その他(なぜ通ったか?等)

ネットワークや損失関数はあまりに複雑だが、zero-shot Learningの性能だけでなく、Localizationの機能向上、さらには概念的labelも扱うという従来課題の克服など、文句なしの実験成果を見せつけたと言える。