#154
summarized by : Munetaka Minoguchi
D2Det: Towards High Quality Object Detection and Instance Segmentation

どんな論文か?

Faster R-CNNのような2stage detectorでRPN以降の位置回帰とクラス分類をそれぞれ改善。位置回帰ではRPN後の特徴 (k x k)をk^2個の局所特徴量と見立て、正解bboxとの重なった各局所特徴のみからオフセットを学習することで、denceな推定を実現。クラス分類では動的な位置からのpoolingを軽量化し、さらに重み付きのpoolingを経てFC層による分類を提案。
placeholder

新規性

従来のFaster/ Grid R-CNNとはまた異なった、Denceなbbox回帰の提案。2つのPoolingを通過するクラス分類の提案。

結果

MS COCOによる検証で、backboneがResNet-101の場合で45.4AP、マルチスケール学習を行えば50.1APと、従来の2stage detectorと比較して高い数値を記録。処理速度も、高い検出精度の割りに高速であるのが利点。また、インスタンスセグメンテーションにも応用でき、こちらも高精度かつ高速。

その他(なぜ通ったか?等)