#593
summarized by : Hideki Tsunashima
DuLa-Net: A Dual-Projection Network for Estimating Room Layouts From a Single RGB Panorama

どんな論文か?

360度カメラで撮った長方形の画像一枚を入力として、天井視点からみた部屋のレイアウトを構成する課題において、通常の360度カメラで撮った画像と天井視点に変換した画像二種類を枝分かれしたネットワークで処理し、結合する フレームワークを提案して、SOTAを達成。 また、end-to-endでの学習が可能である。
placeholder

新規性

360度カメラの画像からフロアと天井の確率マップを出力し、天井視点画像からはフロアの確率マップを出力して両者を結合してよりオクルージョンに強く、複雑な部屋の構造でも予測可能にした点。

結果

Realtor360 datasetにおいて2D、3DIoUにてSOTAを達成。

その他(なぜ通ったか?等)

既存手法に比べて定量的評価であるIoUにおいてSOTAを達成し、オクルージョンや複雑な部屋の構造にも強くなった手法ゆえに結果の見栄えがとても良いため通ったと考えられる。 また、天井視点画像を使うという独創性も評価されたと考えられる。