#20
summarized by : Keisuke Kamahori
CPGAN: Content-Parsing Generative Adversarial Networks for Text-to-Image Synthesis

どんな論文か?

与えられたテキストから画像を生成するタスクにおいて、テキスト・画像の両方を parse して学習する手法を提案し、SOTA を達成。
placeholder

新規性

テキスト・画像を単語やオブジェクトごとに分割して学習することで、より意味的に適合する画像の生成を目指した。また、局所的な一致を調べる Discriminator を新たに設計した。

結果

COCO データセットにおいて SOTA を達成(inception score が 35.69 から 52.73)。

その他(なぜ通ったか?等)

既存の SOTA から大幅に性能を向上させた。 https://github.com/dongdongdong666/CPGAN