#673
summarized by : 福沢栄治
Detection in Crowded Scenes: One Proposal, Multiple Predictions

どんな論文か?

混雑したシーンで非常に重なり合ったオブジェクトを検出することを目的として、以前の単一のインスタンスではなく、相関するインスタンスのセットを予測させるオブジェクト検出器を提案した。EMD LossやSet NMSなどの新しい技術を用いて、FPN-Res50ベースラインで、Crowd-Humanデータセットで4.9%のAPを達成、CityPersonsデータセットで1.0%のMR-2改善をできた。
placeholder

新規性

この論文で、非常に重なり合ったインスタンスのセットを予測することで、まずインスタンスセット予測の学習を監視するために、EMD損失が提案されました。次に、群集シーンでの素朴なNMSの欠点を克服することを目的とした、異なる提案からの重複を抑制するために、Set NMSという新しい後処理方法が導入されました。最後に、オプションの改良モジュール(RM)は、潜在的な誤検知を処理するように設計されています。

結果

この論文では、混雑したインスタンス検出のために特別に設計された、非常にシンプルで効果的な提案ベースのオブジェクト検出器を提案しました。この方法は、複数インスタンス予測の概念を利用し、EMD損失、Set NMS、改良モジュールなどの新しい手法を導入しました。この手法は、ほとんどの最先端の提案ベースの検出フレームワークであり、より混雑していないシナリオに対しても一般化できます。

その他(なぜ通ったか?等)

混雑しているオブジェクトの検出は効果的です。