#315
summarized by : Shuhei M. Yoshida
Disentangling Visual Embeddings for Attributes and Objects

どんな論文か?

物体クラスとその属性の組をゼロショットで認識するタスク、compositional zero-shot learning (CZSL)の論文。物体クラスや属性が既知であっても組み合わせとしては訓練データに含まれないようなものに対して汎化させる。特に、属性の差による僅かな特徴の違いを捉えられるようにすることがこの論文の狙いである。
placeholder

新規性

物体クラスの特徴量と属性の特徴量が独立となるように特徴抽出するOADisを提案。視覚的特徴量の空間で物体特徴と属性特徴を合成し、これと言語特徴量の空間で物体特徴と属性特徴を合成したものとが整合するように学習することで、訓練データに含まれない物体・属性の組み合わせに対する識別能力を獲得する。

結果

既存のCZSLベンチマークであるMIT-statesとUT-Zapposに加え、新たに提案した大規模ベンチマーク VAW-CZSL で評価。既存の手法を大きく上回る性能を達成した。

その他(なぜ通ったか?等)

https://github.com/nirat1606/OADis