#305
summarized by : 綱島秀樹
Controllable Video Generation through Global and Local Motion Dynamics

どんな論文か?

状態遷移後の画像を生成するglobal motion analysisと、action conditionedの状態遷移後の画像を生成するlocal action analysisによる、コントロール性が高く品質の高い動画生成を可能とするGLASSを提案
placeholder

新規性

・条件付き動画生成のベース評価となるトイデータセットのW-Spritesを提案した点 ・Global Localの制御が有効であることを示した点

結果

ロボットアームマニピュレーションのBAIRと、テニス動画のTennis Datasetにおいて、コントロール性がありながらも高品質な動画を生成可能(Frechet Video Distanceは一部負けているが、テニスの人の領域検出がうまくいっている)

その他(なぜ通ったか?等)

Global Localでの生成が有効であることを示したことと、結構きれいに前景マスクが取れることが良いため通ったのではないかと考えられる。 また、論文の構成が非常にわかりやすく、順番に読んでいけばどういうことがやりたくて、どういうことが提案部分なのかがわかりやすい点も評価が高い要因の1つであると考えられる。 code:https://araachie.github.io/glass/