Multiple Anchor Learning for Visual Object Detection

#881

summarized by : Ryosuke Araki

Wei Ke, Tianliang Zhang, Zeyi Huang, Qixiang Ye, Jianzhuang Liu, Dong Huang

どんな論文か？

一般的なCNNベースの物体検出器は，アンカーによるbbox推定とクラス推定が別で行われるが，この論文ではアンカーを選択して共同で最適化するMultiple Instance Learning（MIL）を提案する．Multiple Anchor Learning（MAL）を用いてアンカーバッグを構築し，それぞれのバッグから代表的なアンカーを信頼度に基づいて選択する．

新規性

COCOデータセットで高いスコアを達成．既存の手法のように，アンカーボックスをクラス尤度で選択するのではなく，アンカーボックスを抑圧・最適化したのち信頼度に基づいて選択する．

結果

COCOで高いスコアを獲得し，CenterNetやRetinaNetなどよりも数%（AP）高精度である．この性能はアンカーの最適な選択だけでなく，アンカーバッグに基づいた暗黙的な特徴量の設計にも起因している．

その他（なぜ通ったか？等）

アンカーを単にNMSで選択するのではなく，またNMSを学習ベースにするのでもなく，アンカーボックスを学習ベースのMALで選択するという機構．ポイントベースの手法よりも高い性能を示している．

このページで利用されている画像は論文から引用しています．