#340
summarized by : Hiroaki Aizawa
Deep Image Spatial Transformation for Person Image Generation

どんな論文か?

Pose-guided person image generationにおける,sourceの人画像をtarget poseに従って空間的に変形するための方法について研究している.これまでは,入力の画素が出力ではどこの画素位置に対応するかを示すflow fieldを予測し,画像空間上でSpatial transformer netで変形していたが,著者らは,特徴空間での新たな変形方法を提案している
placeholder

新規性

特徴空間での変形は新たなコンテンツを生成できるうえ,計算効率も改善するが,特徴と変形要素の相互的制約とbilinear samplingの勾配伝播の問題から,局所解に陥る傾向がある.この問題に対して,globalな相関を捉えたflow fieldから,attention mechanismを用いた新たなサンプリング方法を提案している.

結果

SOTAな先行研究と比較して,DeepFashionとMarket-1501の両データセットで優れた性能であることを定量的に示した.またこのような空間的な変形が用いられているview synthesisやvideo animationのタスクでも本手法の有効性を実証している.

その他(なぜ通ったか?等)