#535
summarized by : yoshiki miyazawa
Generalizable Pedestrian Detection: The Elephant in the Room

どんな論文か?

最先端の歩行者検出器(CSPなど)は、同一データセット内でトレーニング及びテストした場合、優れた性能を示す。しかし、クロスデータセットの評価では、データセットに過剰に適合しない、汎用の物体検出器(Cascade R-CNNなど)が勝ること示した。また、web収集の高密度かつ多様なデータセットは、汎用の物体検出器の性能改善に有効であることを示した。
placeholder

新規性

同一データセット内での性能比較といった当たり前に対し疑問を投げかけ、最先端の歩行者検出器が過剰適合に陥っていることを、クロスデータセット評価によって示した点。

結果

同一データセット(CityPersons, Caltech)評価ではBGCNetが最良だが、クロスデータセット評価では、Cascade R-CNNが最良である。また、web収集のデータセットを用いることで、Cascade R-CNNの性能をCSPに近い性能まで引き上げられることを示している。

その他(なぜ通ったか?等)

タイトルの「The Elephant In The Room」の通り、皆が見て見ぬふりをしている同一データセット評価やSOTAの問題点を指摘したため、通ったのではないかと考えている。また、十分な実験によって主張を裏付けていることも、大切なポイントかもしれない。