#266
summarized by : Rei Tamaru
PatchVAE: Learning Local Latent Codes for Recognition

どんな論文か?

画像全てを学習するのではなく、データセットの中で繰り返し表現されている部分や画像内で類似している部分に着目して画像認識を行うPatchVAEを提案。
placeholder

新規性

画像認識に置いて、画像間での反復される部分をエンコーディングして画像の表現の学習に寄与するVAEフレームワークを提案。従来のVAEと比べてPatchVAEは教師なしの表現の学習が認識精度に強く貢献した。さらに、教師なし表現学習で画像の前面の情報を上手く使える損失関数を提案した点が新規。

結果

教師あり学習に比べて精度が出ていないものの、十分に画像を認識できている結果となり、画像の意味や特徴を捉えることの重要性が証明された。またソース画像とターゲット画像それぞれのoccurrence mapを調べて交換した結果、正しくソース画像の特徴を捉えた画像を出力することに成功した。

その他(なぜ通ったか?等)