#316
summarized by : Haruhi Shida
Continual 3D Convolutional Neural Networks for Real-Time Processing of Videos

どんな論文か?

時空間3次元CNNの新しい計算形式である連続3次元畳み込みニューラルネットワーク(Co3D CNN)を紹介.本手法は通常の 3D CNN と重みの互換性を持つ.また動画をクリップ単位ではなく,フレームごとに処理する.
placeholder

新規性

既存の3D CNN手法は予測品質のみが評価される競技会やベンチマークでは成功を収めているものの,計算コストと処理時間はエネルギー制約やリアルタイム性が求められる多くの実使用例への展開の課題として残っている.本手法の新規性は,これらの実応用時の課題を解決するだけでなく,通常の3D CNNと重み互換性がある点である.

結果

Kinetics-400とCharadesを用いた複数のモデルでの検証で,Continual 3D CNNが既存の3D-CNNの重みを再利用し、同様のメモリ要件と精度を保持しながら、時間受容野に比例して予測ごとの浮動小数点演算(FLOPs)を削減することができることがわかった.

その他(なぜ通ったか?等)

https://github.com/lukashedegaard/co3d