#278
summarized by : Ryosuke Tanno
StoryGAN: A Sequential Conditional GAN for Story Visualization

どんな論文か?

複数の文からなる段落が与えられる、各文に対して画像のシーケンスを生成することでストーリーを視覚化する新しいタスク "Story Visualization(SV)" を提案。
placeholder

新規性

シーンとキャラクタ間のグローバルな一貫性を保ったシーケンシャルな画像生成は従来手法では困難であったが、Story Encoder(ストーリーから低次元埋込ベクトルへの確率的写像)及びContext Encoder(連続した画像生成中にコンテクスト情報をキャプチャ)と2つの判別器(画像判別器とストーリー判別器)を用いて実現。

結果

SV用に修正したCLEVR及びPororoデータセットでcontextual consistency metricsとhuman evaluationにおいてSOTAを達成。

その他(なぜ通ったか?等)