Camera-Space Hand Mesh Recovery via Semantic Aggregation and Adaptive 2D-1D Registration

#714

summarized by : Naoya Chiba

Xingyu Chen, Yufeng Liu, Chongyang Ma, Jianlong Chang, Huayan Wang, Tian Chen, Xiaoyan Guo, Pengfei Wan, Wen Zheng

どんな論文か？

単眼RGB画像から手の姿勢・メッシュの推定を行う手法の提案．はじめにシルエットと関節位置に相当するランドマークを推定，このときランドマークを意味的な関係（何関節目か，どの指か，指先同士の関係）でまとめたものも入力する．次に階層化したSpiralConvのようなデコーダーでメッシュを再現し，シルエットを比較する．

新規性

カメラと手の相対姿勢の推定と手の形状の推定にタスクに分割し，関節位置とシルエットを利用してロバストな推定を実現した点が新規．関節同士の意味的なまとまりを利用すること，SpiralConvを距離に応じて階層化して用いること，メッシュ最構成をCoarse-to-Fineに行うこと，シルエットを一次元に投影して比較すること，ランドマークと予測されたメッシュから相対姿勢を推定することなどのアイデアを導入．

結果

手についてはFreiHAND，RHDで学習・評価，人物についても適用しHuman3.6M，COCOで学習・評価．提案法によって意図したような特徴が学習できており，最構成精度も高いことを示した．

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．