#687
summarized by : Masanori YANO
Learning Spatial-Semantic Relationship for Facial Attribute Recognition With Limited Labeled Data

どんな論文か?

顔の画像から属性を認識するタスクで、少量のラベル付きデータしか使用できない状況でも、大量のラベルなしデータで事前学習してからモデルを構築する手法。
placeholder

新規性

バックボーンのネットワーク構造を共有しつつ、パッチを入力とする3種類の補助タスクで事前学習してから、ラベル付きデータで学習させるSSPLを提案した。補助タスクは、パッチの位置を推定するPRTと、顔のセグメンテーションを行うPSTと、パッチに含まれる顔の部位を推定するPCTから構成される。

結果

ImageNet Pre-trainedのResNet-50をバックボーンとして使用し、CelebAとLFWAのデータセットから使用するデータの比率を変えて正解率の評価を行い、NeurIPS 2020採択のFixMatchを含めた従来手法を上回る結果。

その他(なぜ通ったか?等)

十分な数のラベル付きデータを準備することが難しいという実際的な課題に対し、わかりやすい手法で明確な精度向上を示したため通ったと考えられる。