#224
summarized by : Ryo Nakamura
On Label Granularity and Object Localization

どんな論文か?

Weakly Supervised Object Localization(WSOL)においてどのような粒度のラベルを用いて学習すべきか?という問いを調査した研究. ラベルの粒度とはカテゴリがどの程度特定されているかということであり粗い粒度(例:動物)から細かい粒度(例:メンフクロウ)まで様々. 論文では,評価のためのデータセットを提案し粗いラベルを用いた学習は従来の学習よりも効率的なことを示した

新規性

・データセットの提案:iNatLoc500は、弱教師付き学習用の138k画像と、検証・テスト用の手動で検証したバウンディングボックス付きの25k画像からなるデータセットである

結果

・WSOLにおけるラベルの粒度の効果を調べ,より粗い粒度で学習することで,従来法に比べ,多くの異なるWSOL手法において大きな性能向上を示した(例:CAMで+5.1 ,CutMixで+6.6向上,指標は MaxBoxAccV2) ・粗いラベルを用いた学習は,従来の学習よりもデータ効率が良いことを実証. 例)粗いラベルで学習した場合,約15倍少ないラベル数で従来のCAMと同等の性能を達成可能.

その他(なぜ通ったか?等)

WSOLにおけるラベルの粒度の効果を調べるという難しい研究に挑戦し,検証するために新たなデータセットを作成したこと. WSOLで良い効果を出したい場合,データをとにかく集めれば良いというわけでなく,粒度の粗いラベルになるようにデータを収集することが大事であるという知見を発見したから. GitHub(データセット) : https://github.com/visipedia/inat_loc/