#179
summarized by : Keito Ishihara
Semantics Disentangling for Text-To-Image Generation

どんな論文か?

入力テキストからその内容にそった画像を生成するText-to-Imageタスクにおいて、同じ内容を表現するテキストにもばらつきがあることに着目した新たなGANを提案
placeholder

新規性

Siamese structureを利用することで、言語表現のブレに対して同じ内容のテキストに一貫性のある画像の生成を実現した。また文章の意味を埋め込むためのSemantic-Conditioned Batch Normalizationを提案。

結果

CUBとMS-COCOで実験、InceptionScoreによる生成画像のクオリティの評価と人手によるテキストに対する妥当性の評価を行った。

その他(なぜ通ったか?等)