#177
summarized by : Hirokatsu Kataoka
MovieCuts: A New Dataset and Benchmark for Cut Type Recognition

どんな論文か?

動画認識における新規タスクであるCut Type Recognitionを提案、さらにそのデータセットであるMovieCutsを提案した。データセット中には動画のみならず音声のモーダルも含まれている。
placeholder

新規性

新規タスクと同時にデータセットを公開したことが新規性である。MovieCutには173k動画クリップに対して添付画像のように"Cutting on Action", "Reaction Cut", "Smash Cut"などのラベルが付与されており、クリップの位置も含めて推定する。動画編集などへの応用が期待される。

結果

動画と音声の入力ごとにエンコーダを準備して、それぞれで処理するモジュールや統合的に処理するモジュールを構築した。両者を統合しても今回のタスクでは47.9 mAPが最高精度であった。今後のためのベースラインを構築した、という位置付けである。

その他(なぜ通ったか?等)

GitHub: https://github.com/PardoAlejo/MovieCuts