DMC-Net: Generating Discriminative Motion Cues for Fast Compressed Video Action Recognition

#56

summarized by : Kensho Hara

Zheng Shou, Xudong Lin, Yannis Kalantidis, Laura Sevilla-Lara, Marcus Rohrbach, Shih-Fu Chang, Zhicheng Yan

どんな論文か？

圧縮（MPEG-4など）で計算されるmotion vectorを活用する動画中の行動認識において，motion vectorを綺麗にするGeneratorを導入して高精度化する手法を提案．Optical Flowを計算しなくても圧縮動画が既に持つモーション情報を使えるので効率的，でもノイズが多く解像度も低いので精度がいまいちというのが従来．それを綺麗にして認識精度を高めているのが本研究．

新規性

圧縮動画の持つmotion vectorを綺麗にするGeneratorをGAN的に学習して実現，それにより効率的に高精度な行動認識を実現しているところが新しい．

結果

Optical Flowを実際に計算して用いるのに近い認識精度を達成しつつ，2桁分くらい速い計算速度を実現．

その他（なぜ通ったか？等）

みんなOptical Flowは計算したくないので，こういうのができると嬉しい．

このページで利用されている画像は論文から引用しています．