#261
summarized by : Naoya Chiba
3D-SIS: 3D Semantic Instance Segmentation of RGB-D Scans

どんな論文か?

Multi-View RGB-D画像から3Dのセマンティックセグメンテーションを行う.2D画像から画素ごとの情報を推論してから,3DのボクセルにBack Projectionして3D CNNで物体検出する.入力にはTSDFをRGB-D画像に変換して用い,物体の3D RoIとクラスを出力する.
placeholder

新規性

2D画像は2D CNNで処理してから推論結果を3DにBack Projectionして3D CNNで処理するという,2Dと3Dの良さを活かすネットワーク設計を提案し,実際にSoTAを達成している.

結果

Synthetic DataとしてSUNCG,Real-world DataとしてScanNetV2を用いて評価.いずれに対してもmAP@0.25,mAP@0.5でSoTAを更新.実際に結果を表示しても良好に見える.

その他(なぜ通ったか?等)