#323
summarized by : Haruhi Shida
DID-M3D: Decoupling Instance Depth for Monocular 3D Object Detection

どんな論文か?

単眼3D検出において,インスタンスの奥行きは視覚的な奥行き手がかりと物体固有の属性によって連関していることを指摘.そのためネットワークで直接学習することが難しく,従来の直接法では正確に推定することが困難であった.そこで本研究では新たにインスタンスの深さを視覚的深さと属性的深さに分離することを提案.この手法によってネットワークはインスタンスの深さについて異なる種類の特徴を学習することができる.
placeholder

新規性

1.インスタンスの深さの連関性を指摘する.インスタンスの深さを直接予測する従来の方法は,特徴量の絡み合いにより,最適とは言えない.そこで,インスタンス深度を属性深度と視覚深度に分離し,それぞれを独立に予測することを提案する. 2.提案する属性深度と視覚的深度にように分離された深度を用いることで,従来の研究で制限されていた画像に対するアフィン変換に基づくデータ補強を効果的に実行できることを示した.

結果

広範な実験により、提案手法の有効性を実証.特にKITTIベンチマークで評価した結果,本手法はSOTAを達成した.(添付画像)また広範なアブレーション研究により,本手法の各コンポーネントの有効性が実証された.

その他(なぜ通ったか?等)