#352
summarized by : 鈴木共生
Occlusion-Robust Face Alignment Using a Viewpoint-Invariant Hierarchical Network Architecture

どんな論文か?

マスクなどオクルージョンが大きい顔画像に対する高精度な顔パーツ検出.従来の研究では,極端なオクルージョン(50%以上顔が隠れている)に対応できなかった.提案法では、GLOMという階層表現をネットワークに組み込むことで,この問題を解決している.
placeholder

新規性

提案法のネットワーク構造は画像のとおり.まず,画像左のように顔パーツのパッチを入力として,小規模なグループ(左目など)単位で処理を行うことで小さなオクルージョンに対応する.その後,階層的にグループを大きく(両目と両眉など)し,大きなオクルージョンに対応する.画像右のデコーダ―部分では逆に顔パーツ全体から,細かいパーツに分解するタスクを行うことで高精度な顔パーツ座標推定を実現している.

結果

オクルージョンを含むデータセットであるCOFW29,COFW68,Masked 300WにおいてNMEおよびFRで評価.多くの項目で従来法を上回りSOTAを達成した.

その他(なぜ通ったか?等)

オクルージョンという問題に対して,階層構造を組み込んだ新しいネットワークを提案し,高精度を達成していること.また,Transformerのように顔パーツのパッチを入力することで,従来法と比較して計算量の削減できていること.