#159
summarized by : GOTO Keita
Improving Action Localization by Progressive Cross-Stream Cooperation

どんな論文か?

時空間行動認識のための領域検知を改善するモデルを提案。本研究ではRGBとOptical FlowからR-CNNを用いてRegion Proposalを行った後に、RGBのRegion ProposalをOptical FlowのRegion Proposalを用いて改善、またその逆も行う。これを何度か繰り返しRegion Proposalを改善していく。
placeholder

新規性

Region Proposalの結果を次第に改善していく、クロスモーダル的だが複雑な結合を用いている。

結果

video-level mAPではUCF-101-24とJ-HMDBにおいて共にSOTA、frame-level mAPではUCF-101-24においてはSOTA

その他(なぜ通ったか?等)

複数のデータ表現を結合する方法を工夫している