#810
summarized by : Ryota Suzuki
MetaFuse: A Pre-trained Fusion Model for Human Pose Estimation

どんな論文か?

マルチカメラによるポーズ推定において,多数方向からの撮影データCMU Panoptic datasetでカメラ間のポーズヒートマップの空間的変換を含んだ学習をする.その空間的変換にメタ学習の枠組みを導入.その学習済みモデルをもとに,より少数のカメラ(例えば4つとか)でのポーズ推定が良くできる.
placeholder

新規性

ポーズ推定における多視点統合に明な幾何学的変換を混ぜて学習可能にしし,良好な結果を示すことを明らかにした点.

結果

幾何変換パラメータを明に学習しない先行手法NaiveFuseではfine-tuningの枚数が50程度だとシングルビューよりも関節点推定精度が悪かったが,本手法では3%程度ほど上回るなど,少数サンプルに対しても良好に働くことを確認.

その他(なぜ通ったか?等)