#604
summarized by : Hiroaki Aizawa
Look-Into-Object: Self-Supervised Structure Modeling for Object Recognition

どんな論文か?

ほとんどの物体認識手法は,誤差を最小化する識別的な視覚パターンの学習に注視しているが,識別的な領域は物体の全体構造に依存し,領域を正確に特定するためには全体の構造を捉えることが重要ではないか?ということから,人間のように物体の領域とその部位の位置を特定し,部位間の構造的な関連性を学習する“Look into object”する方法を提案
placeholder

新規性

提案方法は,同一カテゴリのインスタンス内で共有されている視覚パターンについて,領域レベルの相関を測定し,物体の位置を予測するobject-extent learning moduleと,その予測領域内を部位として,その相対的な位置関係を予測することで物体の内部構造を捉えるspatial context learning moduleから構成.これらはself-supervisedに学習可能.

結果

一般的な画像分類(ImageNet)とFine-grained分類(CUB, Cars, Aircraft)で,一般的なResNetにこれらのモジュールを備えることで,性能が改善することを確認.またobject detectionやsegmentationなど他のタスクにも汎化する方法であることを実証した.

その他(なぜ通ったか?等)