Large-Scale Pre-Training for Person Re-Identification With Noisy Labels

#39

summarized by : Hirokatsu Kataoka

Dengpan Fu; Dongdong Chen; Hao Yang; Jianmin Bao; Lu Yuan; Lei Zhang; Houqiang Li; Fang Wen; Dong Chen

どんな論文か？

監視カメラを想定したラベルなし動画から人物再同定のための教師を割り振り大規模事前学習モデルを構築。各データセットへの追加学習により良好な精度を示すことを明らかにした。手法は教師あり学習により初期ネットワーク学習し教師を割り振ることで事前学習。

新規性

人物を撮影したラベルなし動画に対してNoisy Studentの枠組みで学習でき、高い水準の精度まで到達できることを明らかにした。大規模に撮り溜めた動画像を再利用できるという観点でも有用な手法である。

結果

公開データセットであるCUHK03, DukeMTMC, MSMT17においてそれぞれ5.7, 2.2, 2.3ptの向上が見られた。添付画像はMarket1501/DukeMTMCにおける調査研究。データセットのスケールとmAPが示されており、ImageNet事前学習（IN.sup.）と比較しても高い精度を実現。さらに、提案法を用いるとさらに精度向上（LUPxxx）。

その他（なぜ通ったか？等）

計算リソースがあるのであれば、（ライバルが少なくなるという意味で）大規模事前学習すると良い、ということを示した論文のひとつである。大量に撮り溜めた動画データをいかに使用するか、という好例にもなりうる。

このページで利用されている画像は論文から引用しています．