DEVIANT: Depth EquiVarIAnt NeTwork for Monocular 3D Object Detection

#398

summarized by : Anonymous

Abhinav Kumar; Garrick Brazil; Enrique Corona; Armin Parchami; Xiaoming Liu

どんな論文か？

ニューラルネットワークに用いられているバニラブロックが，射影多様体における任意の3次元平行移動に対して等辺でないことに動機づけられて，本論文では，単眼3D検出におけるモデル化誤差を詳細に研究．既存のスケール等変型ステアラブルブロックを用いて構築したDepth EquiVarIAnt NeTwork (DEVIANT) を提案した．

新規性

近年の単眼法の汎化性を向上させる手法はフリップ，スケール，モザイクやコピーペーストの補強，深度を考慮した畳み込み，幾何を用いるもので，これらの方法はすべて性能を向上させるが，そのバックボーンが射影世界用に設計されていなかった．本研究は，初めて射影多様体の3次元に対するロバスト性の向上というアプローチで汎化性能の向上を図った研究である．

結果

提案手法はKITTIとWaymoのデータセットにおいて画像のみのカテゴリで最先端の（SOTA）単眼3D物体検出結果を達成し，余分な情報を使用する方法と競合する性能を発揮した．またDEVIANTはデータセット間の評価において，バニラCNNバックボーンよりも優れた汎化性を示唆していることを実験的に示した．

その他（なぜ通ったか？等）

https://github.com/abhi1kumar/DEVIANT

このページで利用されている画像は論文から引用しています．