#232
summarized by : pshiko
Rethinking Classification and Localization for Object Detection

どんな論文か?

R-CNN系のモデルで用いられる分類とbox回帰を個別に行う構造(two head)においてFC/Convがそれぞれどう機能するかを実験的に解析し, 最適なhead構造を提案した論文
placeholder

新規性

暗黙的に行われていたtwo head構造に対して, 各head個別の機能を上手く実験によって明らかにしながら最適な組み合わせをbottom upから提案している点.

結果

FCは分類性能は高いがConvより空間感度が高いことから, box回帰にはCNNの方が向いていることを実験で明らかにした。また, サブタスクとして回帰/分類を行うこともメインタスクに良い結果があることを明らかにした. この結果を反映し主にFCに分類をConvに回帰を解かせるDouble Head構造を提案 FPN baselineに対しCOCO にて3 point程度の性能改善を確認した

その他(なぜ通ったか?等)

FCよりCNNのほうが回帰には向いているというのは, 定性的にも納得のできる結果ではあるが, 論文中でのIoUを使った比較では評価指標の差分はわずかであったので, 根拠として扱う指標としては十分かは疑問. ただこれをもとにしたDouble Headの性能向上の高さとDouble HeadのFCとConvを入れ替えた際の性能劣化より主張自体は正しそう.