#628
summarized by : Masanori YANO
RetinaFace: Single-Shot Multi-Level Face Localisation in the Wild

どんな論文か?

画像から2D及び3Dの頂点数の異なる顔検出を、共通したネットワーク構造で行えるRetinaFaceを提案し、公開データセット及び自作データセットで正確な検出ができることを確認した。
placeholder

新規性

バックボーン側はFeature Pyramid Networkベースで、フロントにDeformable Convolution Networkを取り入れたモジュールを適用し、顔の頂点をMulti-LevelかつSingle-Shot(One-Stage)で検出するRetinaFaceを提案した。

結果

2Dの顔検出のWIDER FACEデータセットでAUC及び失敗率の比較を行い、従来手法を上回る結果。3Dの顔検出はAFLW-2000-3DデータセットでNMEの比較を行い、従来手法を上回る結果。また、頂点数1k個の3D顔検出データセットを作成し、サンプル画像で従来手法との定性的な比較を実施。

その他(なぜ通ったか?等)

本来は軽量モデルで2Dの顔検出から3Dまで対応可能という位置付けだったと思われるが、3Dの顔検出に重点を置いた記述で3Dのポスターセッションに通っており、arXivのv1論文( https://arxiv.org/abs/1905.00641v1 )と見比べると書きぶりが違い、本論文を通すために苦心した形跡がうかがえる。