#57
summarized by : Akihiro FUJII
MoViNets: Mobile Video Networks for Efficient Video Recognition

どんな論文か?

行動認識においてX3Dを超える精度・効率性のトレードオフをもつMoViNetsを提案。境界フレームの特徴量マップを保存しておくことで使用メモリ量を押さえながら多くのフレームを考慮できるStream Bufferを提案。
placeholder

新規性

境界フレームの特徴量マップを保存しておくことで使用メモリ量を押さえながら多くのフレームを考慮できるStream Bufferを提案。よく使われるMulti Clipは、使用フレーム数が少なくなるが、Stream Bufferはそれに比べて使えるフレーム数が増える

結果

行動検知データセットであるkinetics-600で効果を確認した。X3Dを超えるトレードオフ性能を達成

その他(なぜ通ったか?等)

Stream Bufferは精度を1%程度低下させるかわりに、メモリを最大1桁節約できるとのこと。行動検知はEdge Deviceでも適用され始めているので、メモリが1桁下がるのは産業応用上、重要な結果だと思う