#180
summarized by : Kensho Hara
The Visual Centrifuge: Model-Free Layered Video Representations

どんな論文か?

画像のレイヤー分解の動画版.図のようにフロントガラスに写っている外の反射と中の人のレイヤーを分解するようなことを実現.学習は人工的に複数の動画をブレンディングしたものを各動画に分解するという形で行っている.
placeholder

新規性

動画全体に大してレイヤー分解を行うという新しい問題設定と,それをするためのネットワーク構造,教師なしの動画から人工的にデータを生成して学習する方法の提案.

結果

人工的の合成していない単一動画に対してうまく分解できていることを確認.

その他(なぜ通ったか?等)

問題設定の新しさと,人工的なデータから学習したものが実際の動画に対しても動くことまで確認できている点が強い.定量評価が難しいタスクであるものの,様々な結果・評価を載せていることも評価されていそう.