Interpretable Image Recognition by Constructing Transparent Embedding Space

#47

summarized by : 日坂　幸次

Jiaqi Wang, Huafeng Liu, Xinyue Wang, Liping Jing

どんな論文か？

人間は通常、自分の推論（分類など）を説明する際に、画像を分解して、その部分から頭の中の概念につながる証拠を指摘します。この認識プロセスにヒントを得て、予測を説明するために、いくつかのパートレベルの解釈可能なニューラルネットワークアーキテクチャが提案されています。しかし、これらはデータ構造が複雑で、個々のパーツの効果と出力カテゴリが混同されてしまうという問題がありました。

新規性

本研究では、高レベルの入力パッチ（例：CNN特徴マップ）と出力カテゴリの橋渡しをするために、プラグインの透明な埋め込み空間（TesNet）を導入することで、解釈可能な画像認識ディープネットワークを設計する。このプラグイン埋め込み空間は、グラスマン多様体上に構築された透明な基底概念で構成されています。

結果

最新の解釈可能な手法と比較すると、TesNetは分類タスクに非常に有益であり、特に予測値の解釈可能性を高め、最終的な精度を向上させます。コードは https://github.com/JackeyWang96/TesNet で公開されています。

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．