#348
summarized by : Keito Ishihara
Deep Blind Video Decaptioning by Temporal Aggregation and Recurrence

どんな論文か?

動画の字幕除去において時間方向のつながりも考慮したblind video decaptioning network(BVDNet)を提案。ECCV Chalearn 2018 LAP Inpainting Competition Track2:Video decaptioningで優勝。
placeholder

新規性

従来ではそのフレームのみに着目していたが、この論文では動画の前後のフレームの情報に着目した。ベースモデルとしてエンコーダー・デコーダーを採用し、連続した数フレームをずらしながら再帰的に入力することで速度と品質の両立に成功。

結果

MSE,ピーク信号対雑音比, structural dissimilarityで評価し全てで一位を達成し、ECCV Chalearn 2018 LAP Inpainting Competition Track2:Video decaptioningで優勝

その他(なぜ通ったか?等)