#543
summarized by : Anonymous
Gate-Shift Networks for Video Action Recognition

どんな論文か?

アクション認識において3D CNNはパラメータ数が多く,また計算量も多い.そこで3Dカーネルを時空間分解するためにGate Shift Module (GSM)を提案している.GSMは2D CNNとシフト操作,シフトするチャネルを選択するゲートから構成される.
placeholder

新規性

2D CNNの結果を2つのグループに分け,シフトするチャネルをゲートを用いて選択している.

結果

something-something v1, Diving48,EPIC-Kitchensで実験.something-something v1,Diving48では精度向上.EPIC-KitchensではSoTAと同程度の精度を達成.

その他(なぜ通ったか?等)