#158
summarized by : Yue Qiu
Generative Sparse Detection Networks for 3D Single-shot Object Detection

どんな論文か?

大規模な3次元点群から物体のBBOXを推定する手法Generative Sparse Detection Networkを提案.提案手法は2つの構造:①階層的スパースTensorエンコーダーを用い入力データの階層的特徴を得る;②GenerativeスパースTensorデコーダーによりスパースな入力から、有効的に物体のBBOXを推定;提案手法はSOTAな精度を得られながら,大幅に運行時間を減らせた.
placeholder

新規性

従来の手法と比べ、処理の時間とメモリーコストを減らせたGenerative sparse tensor decoderを提案:transposed convsとpruningそうによりsparse tensorsのサポートを拡張しながら、尤度が低い物体位置をdiscardする.

結果

①提案の手法GSDNが超大規模な入力を取り扱える.入力をfully-convolutional feed-forwardでプロセスし,Sliding windowsなどの後処理が必要なし;②3つの大規模3次元Indoor sceneデータセットでSOTAな精度を達成しながら,従来のBest手法より3.78倍速い.

その他(なぜ通ったか?等)

①SOTAな精度と処理スピードを達成.②大規模3次元シーンから物体を検出するタスクは実用性が高い.