#23
summarized by : Tsubura Kazuki
Representation Flow for Action Recognition

どんな論文か?

運動表現を学習するために,オプティカルフローアルゴリズムに着想を得たConv層を提案.action recognitionにおけるCNN内のあらゆるチャンネルのフローを捉えるように設計.他のCNNモデルと共にend-to-endで学習可能.複数のフローレイヤを積み重ねることで,「フローの流れ」表現を学習するという新しい概念を紹介.
placeholder

新規性

フローレイヤで任意のCNN特徴マップのフローをキャプチャ可能.パラメータと発散重みを学習可能.単一スケールのみを使用.ワープを実行しない.空間サイズが小さいCNNテンソルでフローを計算する.このことで計算コストを抑えることができる.

結果

ネットワークのどこにフローレイヤを追加するかを検証.入力直後だと精度が低下することが判明し,3番目の残差ブロックのあとに追加すると最も精度が高い. RGBストリームと融合することも検証したが,CNNはすでに多くの外観情報を抽象化しているために有効ではなかった.融合しなくても十分な性能.

その他(なぜ通ったか?等)

様々な実験をしている印象.