Holistic 3D Human and Scene Mesh Estimation From Single View Images

#770

summarized by : Naoya Chiba

Zhenzhen Weng, Serena Yeung

どんな論文か？

単眼画像から人物とシーンにある物体のメッシュ，物体のバウンディングボックス，カメラ姿勢と部屋の大枠を同時に推定する手法の提案．画像上で人体のキーポイントを推定し人体のメッシュを推定し，同じく画像上でのバウンディングボックスから3Dのバウンディングボックスと物体ごとの表面形状を推定，これらを組み合わせてシーンが整合するように最適化する．

新規性

物体が配置されており人物のいるシーンについて，そのシーンにおける物体やポーズに関する教師データなしで既存の物体検出・メッシュ推定・レイアウト推定手法を組み合わせてシーン全体を推定．これらの物体・人物の関係が矛盾しないようなロスを設定し，同時に最適化することでシーン全体についての認識性能が向上した．

結果

PiGraphsデータセットとPROXデータセットで学習・評価，ただしそれぞれのモジュールは別の利用可能なデータセットで事前学習されている．提案する同時最適化によりシーン全体の理解がより適切になることを確認した．

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．