#881
summarized by : Ryosuke Araki
Multiple Anchor Learning for Visual Object Detection

どんな論文か?

一般的なCNNベースの物体検出器は,アンカーによるbbox推定とクラス推定が別で行われるが,この論文ではアンカーを選択して共同で最適化するMultiple Instance Learning(MIL)を提案する.Multiple Anchor Learning(MAL)を用いてアンカーバッグを構築し,それぞれのバッグから代表的なアンカーを信頼度に基づいて選択する.
placeholder

新規性

COCOデータセットで高いスコアを達成.既存の手法のように,アンカーボックスをクラス尤度で選択するのではなく,アンカーボックスを抑圧・最適化したのち信頼度に基づいて選択する.

結果

COCOで高いスコアを獲得し,CenterNetやRetinaNetなどよりも数%(AP)高精度である.この性能はアンカーの最適な選択だけでなく,アンカーバッグに基づいた暗黙的な特徴量の設計にも起因している.

その他(なぜ通ったか?等)

アンカーを単にNMSで選択するのではなく,またNMSを学習ベースにするのでもなく,アンカーボックスを学習ベースのMALで選択するという機構.ポイントベースの手法よりも高い性能を示している.