summarized by : 山田亮佑 (Ryosuke Yamada)
Yutong Bai; Xinlei Chen; Alexander Kirillov; Alan Yuille; Alexander C. Berg
物体検出に有用な表現を事前学習するためには、事前学習時に様々なレベル(例えば,画像レベル,領域レベル,ピクセルレベル等)の情報を活用することが重要であるという仮説に基づいて,ポイントレベルで学習しながら領域レベルでの情報を用いるように設計した対照学習を設計した.
各領域から複数の点をサンプリングし、領域間で点ペアに対して個別に対照学習することにより、点レベルでも表現獲得することを可能とした.
MoCo含めた自己教師あり学習手法よりもMSCOCOやPascalVOC等の物体検出ベンチマークデータセットにおいて高精度な検出精度.