#209
summarized by : Masanori YANO
Short-Term and Long-Term Context Aggregation Network for Video Inpainting

どんな論文か?

動画の修復(Inpainting)において、短期(Short-Term)及び長期(Long-Term)双方のコンテキストを集約するモジュールを組み込んだ深層学習ベースの手法。
placeholder

新規性

境界を意識した短期コンテキストの調整とアテンションに基づく集約を行い、エンコーダに組み込むBSCAと、動画に含まれる長期の特徴を更新アルゴリズムとアテンション機構で集約を行い、デコーダに組み込むDLCAの2種類のモジュールを提案した。

結果

YouTube-VOS及びDAVISのデータセットでマスクした動画の評価を行い、PSNR、SSIM及びVFID(動画のFID)の3種類の評価指標で、従来手法を上回る修復の品質。実行時間に関しても、最短の従来手法と同等の結果。

その他(なぜ通ったか?等)

全体のネットワーク構造が比較的シンプルで、複雑な2種類のモジュールも位置付けが明確に説明されているため通ったと考えられる。