VITON-HD: High-Resolution Virtual Try-On via Misalignment-Aware Normalization

#511

summarized by : 綱島秀樹

Seunghwan Choi, Sunghyun Park, Minsoo Lee, Jaegul Choo

どんな論文か？

・U-Netのアーキテクチャでは不十分であることを明らかにし、高解像度画像の生成を安定させて可能にしたモデルを提案した・手を除いた服と腕のregionを大きめにマスクすることでclothing-agnosticな画像を獲得可能・misaligned regionを除外するためのALIASを提案・高解像度仮想試着データセットも収集、公開

新規性

・初めて高解像度仮想試着を成功した点・misaligned regionを取り除くことができる点・高解像度仮想試着データセットを初めて公開した点

結果

・低解像度 (256x192) ではSOTAとコンパラだが、高解像度 (512x384, 1024x768)においてはSOTA。解像度1kにおいては大きく既存のSOTAを引き離してSOTA ・ALIASによって発生していたアーティファクトを軽減

その他（なぜ通ったか？等）

高解像度の仮想試着がなかなかうまくいかなかった点を改善したのが非常に大きいと考えられる。高解像度仮想試着用データセットを公開したのも大きな貢献。しかしながら、human-parser自体のmisaligned regionは直すことができないため、まだ改善の余地はあり。 code：https://github.com/shadow2496/VITON-HD

このページで利用されている画像は論文から引用しています．