- …
- …
#177
summarized by : Hirokatsu Kataoka
どんな論文か?
動画認識における新規タスクであるCut Type Recognitionを提案、さらにそのデータセットであるMovieCutsを提案した。データセット中には動画のみならず音声のモーダルも含まれている。
新規性
新規タスクと同時にデータセットを公開したことが新規性である。MovieCutには173k動画クリップに対して添付画像のように"Cutting on Action", "Reaction Cut", "Smash Cut"などのラベルが付与されており、クリップの位置も含めて推定する。動画編集などへの応用が期待される。
結果
動画と音声の入力ごとにエンコーダを準備して、それぞれで処理するモジュールや統合的に処理するモジュールを構築した。両者を統合しても今回のタスクでは47.9 mAPが最高精度であった。今後のためのベースラインを構築した、という位置付けである。
その他(なぜ通ったか?等)
GitHub: https://github.com/PardoAlejo/MovieCuts
- …
- …