#643
summarized by : Masanori YANO
Learning To Predict Visual Attributes in the Wild

どんな論文か?

画像に含まれるオブジェクトの複数の属性に関して、PositiveだけでなくNegativeのラベルも付与し、オブジェクトのセグメンテーションも実施したデータセットの論文。
placeholder

新規性

既存のVGPhraseCut及びGQAのデータセットを活用して、620種類の属性ラベルのPositive及びNegativeを付与し、セグメンテーションのマスクも作成したVAWデータセットを提案した。また、Negativeも含めたマルチラベルを活用した対照学習アルゴリズムのSCoNEも提案した。

結果

VAWデータセットに含まれる画像は72,274枚で、オブジェクトのインスタンスはCOCO Attributesデータセットを上回る260,895個となり、一個あたり平均3.56種類の属性を付与した。また、ResNet-50とアテンション機構を使用したベースラインのモデルにSCoNEを適用すると、従来手法を上回る結果。

その他(なぜ通ったか?等)

画像からの認識のタスクに対し、今後の新たな研究の可能性を示したため通ったと考えられる。VAWデータセットのプロジェクトページ( https://vawdataset.com/ )が公開されている。