#498
summarized by : Anonymous
StyleSwin: Transformer-Based GAN for High-Resolution Image Generation

どんな論文か?

高解像度画像のGANモデルにおいて、いまだにConvNetが主流。 本論文がtransformersで高解像度画像GAN「StyleSwin」を提案。 ポイントとしてSwin transformersを導入することで、計算量と画像生成能力のバランスが取れること。結果としてConvNetを大幅に凌駕することができた

新規性

高解像度画像のGANにtransformersを導入

結果

FFHQ、CelebA- HQ、LSUN Churchなどにおいて、高い性能を示す。 CelebA-HQ 1024が4.43を達成し、StyleGAN を含む全ての先行研究を凌駕した。 FFHQ-1024が5.07を達成し、StyleGAN2 に近い性能を示した。

その他(なぜ通ったか?等)