#78
summarized by : Yoshi Truong
Aesthetic Text Logo Synthesis via Content-Aware Layout Inferring

どんな論文か?

テキスト内容+画像を用いてテキストバナーのレイアウトを生成する研究。
placeholder

新規性

(1)言語特徴+視覚的特徴を融合し、GANの制約にすること (2)2つのDiscriminator(言語+画像)を同時に使用すること (3)Spatial Transform Networks(STN)ベースの微分可能な画像レンダリング方法 (4)Annotation付きのテキストバナーデータセットTextLogo3K(中国語)

結果

先行研究がないため、ベースライン比較をしなかった。代わりに、ablation studyとuser studyで評価を行った。 - ablation studyで言語特徴、視覚的特徴、2つのDiscriminatorどれでも有力だと判明した。言語Discriminatorの影響は特に強い。 - user studyで生成したデザインは人間がデザインしたものとほぼ同レベルということがわかった。

その他(なぜ通ったか?等)

GitHub(データセット含む):https://github.com/yizhiwang96/TextLogoLayout 中国語中心の研究なので、日本語にも適用しやすい気がする。