#220
summarized by : Shuhei M Yoshida
Revisiting Perspective Information for Efficient Crowd Counting

どんな論文か?

群衆カウントの論文。 遠近法により、画像上の位置によって長さのスケールが変わることに群衆カウントの困難がある。提案手法では、perspective map(各点における1m当たりのピクセル数)として各点のスケールをエンコードし、これに基づいて異なるスケールで推定した群衆密度を統合する。
placeholder

新規性

(1) 画像中の人物のサイズをフィッティングし、群衆カウント用学習データのperspective mapの正解データを生成する方法 (2) 複数のスケールで群衆密度とperspective mapを推定するCNNを学習する。推論時には、異なるスケールの群衆密度を、perspective mapの値に基づいて各点ごとに重み付け平均することで、最終的な群衆密度の推定マップを得る。

結果

ShanghaiTech, WorldExpo’10, UCF FF 50, UCSDの各データセットで従来のSOTAに匹敵、またはそれを上回る精度を達成。

その他(なぜ通ったか?等)