- …
- …
#371
summarized by : Masanori YANO
どんな論文か?
物体検出におけるロングテール(カテゴリを多くした分、インスタンス数が少ないカテゴリも多く含まれ教師データが不均衡な状況)への対策として、グループに分けてソフトマックス関数で分類を行うBAGSモジュールを提案し、ロングテールを特色とするLVISデータセットで性能向上を確認した。
新規性
物体検出のうちクラス分類を行う処理で、クラスをインスタンス数の大きさでグループ分けし、訓練時はグループごとにソフトマックス関数及びクロスエントロピーで学習を行い、推論時は複数グループのソフトマックス関数の出力を統合して確率となるように補正するBAGSモジュールを提案した。
結果
BAGSモジュールをFaster R-CNN及びCascade R-CNNに適用し、LVISデータセットにおいて、mAPが3%~6%向上。Faster R-CNNでは既存手法との比較も行い、mAPではSOTAの結果。また、インスタンスセグメンテーションでもMask R-CNN及びHTCに適用して、mAPではSOTAの結果。
その他(なぜ通ったか?等)
シンプルな手法で、既存のDetectorに付与するモジュールとして効果を示していることと、不均衡が検出性能に与える悪影響の分析から提案手法の説明及び実験に至るまで記述の流れが一貫していることが通った要因と考えられる。Figure 1が手法の解説ではなく、LVISデータセット及びCOCOデータセットでロングテールを分析した結果であることにも通すための戦略性を感じる。
- …
- …