#504
summarized by : Higaki Yoshinari
Scale-Equalizing Pyramid Convolution for Object Detection

どんな論文か?

DNNによる物体検出で用いられるfeature pyramidについて、従来はスケールごとに独立にコンテクスト情報を抽出していたが、DNN以前のスケール不変特徴量に倣い、スケール方向の畳み込みを行うように3D convolutionを応用し、精度と速度のトレードオフにおいてSOTAの性能を出した。
placeholder

新規性

feature pyramidに対する3D convolutionとして、スケールごとにstrideを変えるpyramid convolution (PConv)を新たに構築。classification/localization branchにおいて、最初の4つのconvを共通のPConvに置き換えたことで高速化。

結果

MS-COCO2017データセットにおいて、従来のOne-Stage/Two-Stage detectorのいずれも、APにおいて2ポイント以上凌駕。

その他(なぜ通ったか?等)

非常に網羅的な検証がなされており、速度と精度を両立してSOTA水準がである点が評価のポイントと考えられる。また、最近のfeature pyramidを用いる代表的な手法(FSAF,FCOS,RetinaNet,FreeAnchor,Faster等)いずれに対し本手法を適用しても、一様にAPにおいて2ポイント以上の向上が見られることから、汎用的な手法であることが検証されたことも重要といえる。