#387
summarized by : Shoma Iwai
Fine-Grained Image-to-Image Transformation Towards Visual Recognition

どんな論文か?

画像のidentityを保ちながら変換(視点の変換など)を行う。変換後も細かいクラス分類(車の種類の分類など)が成功するように、画像の品質よりもidendityを保持することを重視する。GANの構造を持ち、Gは画像を変換し、Dはidentity(クラス)とattribute(向きなどの情報)を予測する。
placeholder

新規性

identityを保つため、Adaptive Identity ModulationとConstrained Nonalignment Connectionを提案。どちらも画像生成時に入力画像のidentity情報を参照させるモジュールである。また、identityを保つことができるため、few-shot classifierのDAとして有効である。

結果

生成画像をfine-grainedクラス分類器に入力して予測精度を比較すると、既存手法を大きく上回った。生成画像をDAとしてfew-shot classifierの学習を行った結果、既存手法でDAをした場合よりも精度が大きく向上した。

その他(なぜ通ったか?等)