- …
- …
#498
summarized by : Anonymous
どんな論文か?
高解像度画像のGANモデルにおいて、いまだにConvNetが主流。
本論文がtransformersで高解像度画像GAN「StyleSwin」を提案。
ポイントとしてSwin transformersを導入することで、計算量と画像生成能力のバランスが取れること。結果としてConvNetを大幅に凌駕することができた
新規性
高解像度画像のGANにtransformersを導入
結果
FFHQ、CelebA- HQ、LSUN Churchなどにおいて、高い性能を示す。
CelebA-HQ 1024が4.43を達成し、StyleGAN を含む全ての先行研究を凌駕した。
FFHQ-1024が5.07を達成し、StyleGAN2 に近い性能を示した。
その他(なぜ通ったか?等)
- …
- …