#957
summarized by : a2kiti
Cascaded Deep Monocular 3D Human Pose Estimation With Evolutionary Training Data

どんな論文か?

3次元姿勢推定用の学習データは、 人手でのラベル付けが難しく高価なモーションキャプチャーシステムを必要とするため、 十分な多様性を持つデータセットを用意することが難しい。 著者らは限られたデータセットで多様性を向上するための進化的演算を用いたデータ増強手法を提案。
placeholder

新規性

遺伝的アルゴリズムで用いられるような交叉・突然変異といった進化的な演算を用いたデータセット増強方法を提案。 Upsamplingとsoft-argmaxを用いた2D検出器の精度改善と新たなカスケード型の2D->3Dネットワークも提案。

結果

Human3.6Mを用いた実験では、一人のアクターのデータのみを使った弱教師有り学習において、 マルチビューや時系列情報を用いた他手法を超える精度を達成。 全データを用いた教師あり学習やHuman3.6Mのみを学習に用いたMPI-INF-3DHPでの評価でもSOTAを達成。

その他(なぜ通ったか?等)

効果的なデータ増強により単眼シングルフレームモデルで、マルチビューや時系列情報を使うモデルを超える性能を達成した点。 提案手法はマルチビューデータや時系列データへの応用も期待される。