#997
summarized by : 福沢 栄治
Self-Supervised Human Depth Estimation From Monocular Videos

どんな論文か?

既存の手法では、深度を推定するために、深度の正解データを使って教師付きトレーニングが必要になる。この論文では、深度の成果なしでYouTubeビデオでトレーニングできる自己監視方式を紹介します。
placeholder

新規性

自己監視学習は、フォトコンシステンシーの損失を最小限に抑えることにより、推定された深度と人体の3D非剛体運動に従ってワープされたビデオフレームとその隣接フレーム間で評価されます。この非剛体運動を解決するには、まず各ビデオフレームで大まかなSMPLモデルを推定し、それに応じて非剛体運動を計算します。これにより、形状の詳細を推定する際の自己監視学習が可能になります。

結果

実験は、私たちの方法がより一般化できるし、室外のデータに対してはるかに優れたパフォーマンスを発揮することを示しています。

その他(なぜ通ったか?等)