Aesthetic Text Logo Synthesis via Content-Aware Layout Inferring

#78

summarized by : Yoshi Truong

Yizhi Wang; Guo Pu; Wenhan Luo; Yexin Wang; Pengfei Xiong; Hongwen Kang; Zhouhui Lian

どんな論文か？

テキスト内容＋画像を用いてテキストバナーのレイアウトを生成する研究。

新規性

（１）言語特徴＋視覚的特徴を融合し、GANの制約にすること（２）２つのDiscriminator（言語＋画像）を同時に使用すること（３）Spatial Transform Networks（STN）ベースの微分可能な画像レンダリング方法（４）Annotation付きのテキストバナーデータセットTextLogo3K（中国語）

結果

先行研究がないため、ベースライン比較をしなかった。代わりに、ablation studyとuser studyで評価を行った。 - ablation studyで言語特徴、視覚的特徴、２つのDiscriminatorどれでも有力だと判明した。言語Discriminatorの影響は特に強い。 - user studyで生成したデザインは人間がデザインしたものとほぼ同レベルということがわかった。

その他（なぜ通ったか？等）

GitHub（データセット含む）：https://github.com/yizhiwang96/TextLogoLayout 中国語中心の研究なので、日本語にも適用しやすい気がする。

このページで利用されている画像は論文から引用しています．