#751
summarized by : Hirokatsu Kataoka
Interpretable and Accurate Fine-grained Recognition via Region Grouping

どんな論文か?

領域ごとの特徴量グルーピングにより詳細画像認識問題(Fine-grained Recognition)における解釈性(Interpretability/Explainability)を高める研究である。
placeholder

新規性

構造は図に示す通りである。パーツごとに分離するモジュール(Part Segmentation and Feature Extraction)とアテンションを抽出するモジュール(Attention-based Classification)に分離される。詳細画像認識問題では部分ごとに特徴量を抽出する手法が有効とされており、本研究では順当かつシンプルに改善を実現した。

結果

CUB-200, CelebA, iNaturalistにおいて解釈性を調査した。超多カテゴリの詳細画像認識問題であるiNaturalistではResNet-101ベースラインと比較した結果、5.7%もの精度向上を実現した。

その他(なぜ通ったか?等)

解釈性を高めつつ、最高精度(SOTA)を達成したことがOral採択の理由である。