Memory-Guided Unsupervised Image-to-Image Translation

#769

summarized by : Masanori YANO

Somi Jeong, Youngjung Kim, Eungbean Lee, Kwanghoon Sohn

どんな論文か？

画像のドメイン変換で、変換するネットワーク構造の内部にメモリーネットワークを組み込んだ手法。

新規性

KeyとValueから構成されるメモリー構造で、画像に含まれる物体や背景のクラスごとに記憶域を管理してコンテンツとスタイルを引き出せるように学習させるMGUITを提案した。DUNITと異なり、推論のときには物体検出のモデルを必要としない。

結果

INITデータセットを使用した定量的な比較では、Sunny⇔Night、Sunny⇔Rainy及びSunny⇔Cloudyのうち「Rainy→Sunny以外」の5通りの結果が掲載されていて、従来手法を上回る結果。実装がある従来手法との定性的な比較ではRainy→Sunnyを含めた結果を示し、実装が公開されていないDUNITは論文の掲載画像との比較を実施。

その他（なぜ通ったか？等）

CVPR 2020採択のDUNITをベースラインとして優位性を示し、従来手法では難しかった変換を含む6通りの変換結果を示したことで通ったと考えられる。DUNITの論文では実施されているRainy→Sunnyの定量的な比較が掲載されていないことが気になった。

このページで利用されている画像は論文から引用しています．