#383
summarized by : Naoya Chiba
GrooMeD-NMS: Grouped Mathematically Differentiable NMS for Monocular 3D Object Detection

どんな論文か?

単眼3D物体認識において一般的なNMS (Non-Max Suppression)による物体検出を微分可能にし,End-to-Endで物体検出を可能にした.NMSを行列演算として定式化,ヘッドの出力するボックスをグループ化してマスクすることでClosed-formでグループ化された物体検出結果を得る.ここでの演算がすべて微分可能であり,検出結果からネットワーク全体の学習が可能となる.
placeholder

新規性

スコアでソート後,出力している領域ごとにスコアが最大となっている要素を採用しそれ以外をPruning functionsで出力を限定,この手続きでソフトにNMSを行う処理を行列演算として実装し微分可能にした.

結果

KITTIで検証し,2D画像から3D物体領域を推定.動画像として扱う手法と同程度,それ以外の多くの手法よりも良い物体検出性能を達成した.

その他(なぜ通ったか?等)