#911
summarized by : Ryota Nishijima
Context-Aware Crowd Counting

どんな論文か?

画像に写る群衆を計数するcrowd countingのタスクで、近年CNNを用いてdensity mapを求める手法が使われているが、様々な大きさの人間を見つけるために入力画像をさまざまな大きさに変化させて計算を行っていた。これは人間のスケールが連続的に変化することを無視していた。
placeholder

新規性

単一の入力画像からさまざまなスケールの特徴量を考慮できる仕組みを提案。VGGの特徴マップをAvg. poolingで様々なサイズに変更し、それらを統合した。

結果

複数のデータセットで従来のベースラインよりも良いMAE,RMSEを達成した。

その他(なぜ通ったか?等)