RetinaFace: Single-Shot Multi-Level Face Localisation in the Wild

#628

summarized by : Masanori YANO

Jiankang Deng, Jia Guo, Evangelos Ververas, Irene Kotsia, Stefanos Zafeiriou

どんな論文か？

画像から2D及び3Dの頂点数の異なる顔検出を、共通したネットワーク構造で行えるRetinaFaceを提案し、公開データセット及び自作データセットで正確な検出ができることを確認した。

新規性

バックボーン側はFeature Pyramid Networkベースで、フロントにDeformable Convolution Networkを取り入れたモジュールを適用し、顔の頂点をMulti-LevelかつSingle-Shot(One-Stage)で検出するRetinaFaceを提案した。

結果

2Dの顔検出のWIDER FACEデータセットでAUC及び失敗率の比較を行い、従来手法を上回る結果。3Dの顔検出はAFLW-2000-3DデータセットでNMEの比較を行い、従来手法を上回る結果。また、頂点数1k個の3D顔検出データセットを作成し、サンプル画像で従来手法との定性的な比較を実施。

その他（なぜ通ったか？等）

本来は軽量モデルで2Dの顔検出から3Dまで対応可能という位置付けだったと思われるが、3Dの顔検出に重点を置いた記述で3Dのポスターセッションに通っており、arXivのv1論文( https://arxiv.org/abs/1905.00641v1 )と見比べると書きぶりが違い、本論文を通すために苦心した形跡がうかがえる。

このページで利用されている画像は論文から引用しています．