#398
summarized by : Anonymous
DEVIANT: Depth EquiVarIAnt NeTwork for Monocular 3D Object Detection

どんな論文か?

ニューラルネットワークに用いられているバニラブロックが,射影多様体における任意の3次元平行移動に対して等辺でないことに動機づけられて,本論文では,単眼3D検出におけるモデル化誤差を詳細に研究.既存のスケール等変型ステアラブルブロックを用いて構築したDepth EquiVarIAnt NeTwork (DEVIANT) を提案した.

新規性

近年の単眼法の汎化性を向上させる手法はフリップ,スケール,モザイクやコピーペーストの補強,深度を考慮した畳み込み,幾何を用いるもので,これらの方法はすべて性能を向上させるが,そのバックボーンが射影世界用に設計されていなかった.本研究は,初めて射影多様体の3次元に対するロバスト性の向上というアプローチで汎化性能の向上を図った研究である.

結果

提案手法はKITTIとWaymoのデータセットにおいて画像のみのカテゴリで最先端の(SOTA)単眼3D物体検出結果を達成し,余分な情報を使用する方法と競合する性能を発揮した.またDEVIANTはデータセット間の評価において,バニラCNNバックボーンよりも優れた汎化性を示唆していることを実験的に示した.

その他(なぜ通ったか?等)

https://github.com/abhi1kumar/DEVIANT