MovieCuts: A New Dataset and Benchmark for Cut Type Recognition

#177

summarized by : Hirokatsu Kataoka

Alejandro Pardo; Fabian Caba; Juan León Alcázar; Ali Thabet; Bernard Ghanem

どんな論文か？

動画認識における新規タスクであるCut Type Recognitionを提案、さらにそのデータセットであるMovieCutsを提案した。データセット中には動画のみならず音声のモーダルも含まれている。

新規性

新規タスクと同時にデータセットを公開したことが新規性である。MovieCutには173k動画クリップに対して添付画像のように"Cutting on Action", "Reaction Cut", "Smash Cut"などのラベルが付与されており、クリップの位置も含めて推定する。動画編集などへの応用が期待される。

結果

動画と音声の入力ごとにエンコーダを準備して、それぞれで処理するモジュールや統合的に処理するモジュールを構築した。両者を統合しても今回のタスクでは47.9 mAPが最高精度であった。今後のためのベースラインを構築した、という位置付けである。

その他（なぜ通ったか？等）

GitHub: https://github.com/PardoAlejo/MovieCuts

このページで利用されている画像は論文から引用しています．