Selective Feature Compression for Efficient Activity Recognition Inference

#46

summarized by : 日坂　幸次

Chunhui Liu, Xinyu Li, Hao Chen, Davide Modolo, Joseph Tighe

どんな論文か？

ほとんどの行動認識ソリューションは、情報のある時間的クリップを正確にカバーするために、高密度のサンプリングに依存しています。しかし、時間領域を広範囲に探索することは、現実のアプリケーションではコストがかかります。

新規性

本論文では、精度を損なうことなくモデルの推論効率を大幅に向上させる行動認識の推論戦略であるSelective Feature Compression (SFC)を紹介します。カーネルサイズを圧縮してチャネル次元を小さくする従来の手法とは異なり、我々は、バックボーンのパラメータを変更することなく、時空間次元に沿って特徴を圧縮することを提案する。

結果

Kinetics-400、UCF101、ActivityNetを用いた実験により、SFCは一般的に使用されている30クロップの密なサンプリング手順と比較して、推論速度を6～7倍、メモリ使用量を5～6倍に削減できる一方で、Top1精度をわずかに向上させることができた。また、定量的・定性的な評価を行い、SFCが行動認識タスクにおいて重要なビデオ領域への参加を学習する様子を示しています。

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．