#770
summarized by : Naoya Chiba
Holistic 3D Human and Scene Mesh Estimation From Single View Images

どんな論文か?

単眼画像から人物とシーンにある物体のメッシュ,物体のバウンディングボックス,カメラ姿勢と部屋の大枠を同時に推定する手法の提案.画像上で人体のキーポイントを推定し人体のメッシュを推定し,同じく画像上でのバウンディングボックスから3Dのバウンディングボックスと物体ごとの表面形状を推定,これらを組み合わせてシーンが整合するように最適化する.
placeholder

新規性

物体が配置されており人物のいるシーンについて,そのシーンにおける物体やポーズに関する教師データなしで既存の物体検出・メッシュ推定・レイアウト推定手法を組み合わせてシーン全体を推定.これらの物体・人物の関係が矛盾しないようなロスを設定し,同時に最適化することでシーン全体についての認識性能が向上した.

結果

PiGraphsデータセットとPROXデータセットで学習・評価,ただしそれぞれのモジュールは別の利用可能なデータセットで事前学習されている.提案する同時最適化によりシーン全体の理解がより適切になることを確認した.

その他(なぜ通ったか?等)