- …
- …
#270
summarized by : Naoya Chiba
どんな論文か?
Mask R-CNNのアイデアを用いて一枚のRGB画像からシーン中の三次元平面を推定する.3つの要素(Mask R-CNN, Segmentation Refinement Network, Warping Loss Module)から構成.Mask R-CNNではカテゴリの代わりに平面か否かと法線を出力し,単眼Depth推定の結果と合わせて全マスクを統合してRefinementする.
新規性
従来手法と比較し,小さい平面の推定が可能,平面数が未知でもよい,ドメインにあまり依存しないといったメリットがある.ScanNetをもとにデータセットを作成した.ScanNetからNearby Viewの情報を取り出しておき,本手法での学習にも利用する.応用例としてオクルージョン部分の推定を同じアプローチで行うことで新視点画像の生成にも用いることができる.
結果
平面推定に関する評価基準を提案し,ScanNetベースのデータセットによる評価でSoTAを達成した.また,学習に用いていないデータセットに対しても良好な結果を得ている.Ablation Studyについても記述.
その他(なぜ通ったか?等)
- …
- …