The Visual Centrifuge: Model-Free Layered Video Representations

#180

summarized by : Kensho Hara

Jean-Baptiste Alayrac, Joao Carreira, Andrew Zisserman

画像のレイヤー分解の動画版．図のようにフロントガラスに写っている外の反射と中の人のレイヤーを分解するようなことを実現．学習は人工的に複数の動画をブレンディングしたものを各動画に分解するという形で行っている．

動画全体に大してレイヤー分解を行うという新しい問題設定と，それをするためのネットワーク構造，教師なしの動画から人工的にデータを生成して学習する方法の提案．

人工的の合成していない単一動画に対してうまく分解できていることを確認．

問題設定の新しさと，人工的なデータから学習したものが実際の動画に対しても動くことまで確認できている点が強い．定量評価が難しいタスクであるものの，様々な結果・評価を載せていることも評価されていそう．

このページで利用されている画像は論文から引用しています．