#265
summarized by : Rei Tamaru
DeepFashion2: A Versatile Benchmark for Detection, Pose Estimation, Segmentation and Re-Identification of Clothing Images

どんな論文か?

衣服をカテゴリー別に様々なラベル付けをしている大規模データセットを発表。高速に学習可能なベースラインモデルである、Match R-CNNを提案し、各タスクごとの精度を評価。
placeholder

新規性

1枚の画像に複数の衣服とそのラベルが含まれているデータセットを開発。数が多く、ラベルの種類も増え、同様の衣服でも、商用画像と一般画像のペアで配布している点で新規。また、ベースラインモデルとして、衣服の特徴量を抽出するmatch networkを含む、衣服に特化した、より高速な検出が可能なMatch R-CNNを提案。

結果

データセットの画像に対して、scale、occlusion、zoom-in、viewpointの値を変更した画像に対し、Mask R-CNNで検出し、IoUの値を変化させ、AP(Average Precision)によって検出精度を比較。また、ポーズのみ、マスクのみ、といった画像の検出方法に対して、Match R-CNNを用いて精度を検証。

その他(なぜ通ったか?等)