#246
summarized by : Hiromasa Sakata
COIN: A Large-Scale Dataset for Comprehensive Instructional Video Analysis

どんな論文か?

画像中に写っている人数をカウントするcrowd counting において, 人同士が近接している場所で, 再帰的に画像にズームを行っていくRecurrent Attention Zooming Networkの提案. UCF-QNRF などの複数のベンチマークで既存手法を上回るスコアを出した.
placeholder

新規性

画像のLocalization タスクとcrowd counting タスクが再帰的に解かれお互いの精度を向上に貢献するようなネットワークを設計した.

結果

UCF-QNRF などのベンチマークで, 既存手法を上回るスコアを出した. また, counting タスクとlocalizationタスクの組み合わせが スコア向上に寄与することを示した.

その他(なぜ通ったか?等)