#56
summarized by : Kensho Hara
DMC-Net: Generating Discriminative Motion Cues for Fast Compressed Video Action Recognition

どんな論文か?

圧縮(MPEG-4など)で計算されるmotion vectorを活用する動画中の行動認識において,motion vectorを綺麗にするGeneratorを導入して高精度化する手法を提案.Optical Flowを計算しなくても圧縮動画が既に持つモーション情報を使えるので効率的,でもノイズが多く解像度も低いので精度がいまいちというのが従来.それを綺麗にして認識精度を高めているのが本研究.
placeholder

新規性

圧縮動画の持つmotion vectorを綺麗にするGeneratorをGAN的に学習して実現,それにより効率的に高精度な行動認識を実現しているところが新しい.

結果

Optical Flowを実際に計算して用いるのに近い認識精度を達成しつつ,2桁分くらい速い計算速度を実現.

その他(なぜ通ったか?等)

みんなOptical Flowは計算したくないので,こういうのができると嬉しい.