#205
summarized by : 古澤嘉久
Towards Rotation Invariance in Object Detection

どんな論文か?

物体検出におけるAugmentationとして回転を行うと,元の物体が確実に入るように外接にするように大きめにBBOXを作成する方法が取られてきた.しかし,大きめにBBOXをつけ直すと,本当に物体が含まれている領域よりも大きなBBOXを正解とするため,学習に対するノイズとして働き,むしろ性能が下がることが経験的に報告されている.
placeholder

新規性

複数の正解BBOXと複数の回転条件に対して,回転後のIOUが最大になるような形状を求めると,楕円形であることを実験的に確かめた.そこで,元々のBBOXの数値を用いて楕円形として物体を表現し,回転後のBBOXは回転させた楕円の外接として表現するように変更する方法を提案した.また,回転が大きくなるとその分,実際に物体が写っているかどうかの不確実性が存在するため,その点を閾値として設けたロスを提案.

結果

実際のコードに組み込む際にも容易であるにも関わらず,回転に対する予測性能の向上だけでなく,通常の物体検出タスクでも精度の向上が見られた.

その他(なぜ通ったか?等)