#565
summarized by : maokura
Weakly Supervised Complementary Parts Models for Fine-Grained Image Classification From the Bottom Up

どんな論文か?

一般的にCNNは画像中の最も特徴的な部分のみに注目するが,画像中の特徴的な部分全てを逃したくないケースも存在する.物体検出によるproposalが注目領域を大きく囲うという特徴を利用する.CAMで注目点を見つけたのち,CRFでセグメンテーションを行いそれを元にMask R-CNNを訓練.得られた複数パーツの特徴を元にLSTMでクラス分類.
placeholder

新規性

画像中の各クラスの手がかりとなり得るような箇所全てを利用して分類を行うモデルを提案.特に高精細画像を対象とする?

結果

高精細画像データセットとしてStanford Dog 120とCaltech-USD Birds,一般物体データセットとしてcaltech256を用いて実験を行なった.結果としてどのデータセットにおいてもResNet-152などに大きく勝る精度で分類が行えたことを確認した.

その他(なぜ通ったか?等)