MetaFuse: A Pre-trained Fusion Model for Human Pose Estimation

#810

summarized by : Ryota Suzuki

Rongchang Xie, Chunyu Wang, Yizhou Wang

マルチカメラによるポーズ推定において，多数方向からの撮影データCMU Panoptic datasetでカメラ間のポーズヒートマップの空間的変換を含んだ学習をする．その空間的変換にメタ学習の枠組みを導入．その学習済みモデルをもとに，より少数のカメラ（例えば4つとか）でのポーズ推定が良くできる．

ポーズ推定における多視点統合に明な幾何学的変換を混ぜて学習可能にしし，良好な結果を示すことを明らかにした点．

幾何変換パラメータを明に学習しない先行手法NaiveFuseではfine-tuningの枚数が50程度だとシングルビューよりも関節点推定精度が悪かったが，本手法では3%程度ほど上回るなど，少数サンプルに対しても良好に働くことを確認．

このページで利用されている画像は論文から引用しています．