#724
summarized by : Shunsuke NAKATSUKA
Video Summarization by Learning From Unpaired Data

どんな論文か?

タスクは教師なし動画要約.動画と要約された動画の1対1のペアがない状態でvideo setとsummary setから,video => summary のmappingを学習する.ベースモデルはFCSN(Fully Convolutional Sequence Network).
placeholder

新規性

video => summary のmappingを学習するのに,GANを用いる.またUnpairedではあるが,FCSNでdecodeされた特徴ベクトルを畳み込み,入力との再構成誤差をLossに加えている.またフレームが多様性を持つためにdiversity lossも加える.

結果

Unsuperviedな動画要約でSoTA.Superviedと比較しても,多少劣るものの遜色ない精度を達成.

その他(なぜ通ったか?等)

ECCV2018で発表されたFCSNの改良版