- …
- …
#628
summarized by : Masanori YANO
新規性
バックボーン側はFeature Pyramid Networkベースで、フロントにDeformable Convolution Networkを取り入れたモジュールを適用し、顔の頂点をMulti-LevelかつSingle-Shot(One-Stage)で検出するRetinaFaceを提案した。
結果
2Dの顔検出のWIDER FACEデータセットでAUC及び失敗率の比較を行い、従来手法を上回る結果。3Dの顔検出はAFLW-2000-3DデータセットでNMEの比較を行い、従来手法を上回る結果。また、頂点数1k個の3D顔検出データセットを作成し、サンプル画像で従来手法との定性的な比較を実施。
その他(なぜ通ったか?等)
本来は軽量モデルで2Dの顔検出から3Dまで対応可能という位置付けだったと思われるが、3Dの顔検出に重点を置いた記述で3Dのポスターセッションに通っており、arXivのv1論文( https://arxiv.org/abs/1905.00641v1 )と見比べると書きぶりが違い、本論文を通すために苦心した形跡がうかがえる。
- …
- …