- …
- …
#163
summarized by : Shoma Iwai
どんな論文か?
GANは高解像度の画像の生成や編集が可能だが,対話的な編集を行うためには実行時間がネックになる.そこで,時間をかけて高品質な画像を生成するだけでなく,品質は劣るものの似た画像を高速で生成できるAnycostGANを提案.要するにクイックプレビューができるGANである.具体的には1つのGeneratorで解像度・チャンネル数を調整することで計算量を調整し,最大6~12倍の高速化ができる.
新規性
1つのGeneratorで品質と実行速度のトレードオフを調整可能にした
複数の解像度を一度に学習する手法や,チャンネル数を絞ってモデルを実行するadaptive-channel training,Generatorの実行条件に応じてDiscriminatorを条件付けるgenerator-conditioned discriminatorを提案
どのGeneratorでも一貫性のある画像を生成可能
結果
提案手法の学習方法を使うことでFIDが改善することを確認
モデル圧縮や知識蒸留手法よりも,FIDやプレビュー画像と高品質画像の類似度で優れていることを確認
CPUでの実験では,提案手法によって最大11.7倍の高速化を達成
計算コストを抑えつつも,プレビュー画像はフルサイズのGeneratorと非常に似た画像を生成できることを確認
その他(なぜ通ったか?等)
github: https://github.com/mit-han-lab/anycost-gan
demo: https://www.youtube.com/watch?v=_yEziPl9AkM&t=90s
- …
- …