#270
summarized by : Naoya Chiba
PlaneRCNN: 3D Plane Detection and Reconstruction From a Single Image

どんな論文か?

Mask R-CNNのアイデアを用いて一枚のRGB画像からシーン中の三次元平面を推定する.3つの要素(Mask R-CNN, Segmentation Refinement Network, Warping Loss Module)から構成.Mask R-CNNではカテゴリの代わりに平面か否かと法線を出力し,単眼Depth推定の結果と合わせて全マスクを統合してRefinementする.
placeholder

新規性

従来手法と比較し,小さい平面の推定が可能,平面数が未知でもよい,ドメインにあまり依存しないといったメリットがある.ScanNetをもとにデータセットを作成した.ScanNetからNearby Viewの情報を取り出しておき,本手法での学習にも利用する.応用例としてオクルージョン部分の推定を同じアプローチで行うことで新視点画像の生成にも用いることができる.

結果

平面推定に関する評価基準を提案し,ScanNetベースのデータセットによる評価でSoTAを達成した.また,学習に用いていないデータセットに対しても良好な結果を得ている.Ablation Studyについても記述.

その他(なぜ通ったか?等)