#674
summarized by : Kensho Hara
WOAD: Weakly Supervised Online Action Detection in Untrimmed Videos

どんな論文か?

動画単位での弱いアノテーションからOnline Action Detectionをする手法を提案.従来はセグメントレベルのアノテーションが必要なことと,未来情報を使わずに高精度に行動ラベルを識別しつつ開始時刻を正確に推定することは困難だったのが課題.提案するTemporal Proposal GeneratorとOnline Action Recognizerでそれらを解決.
placeholder

新規性

従来でも普通のOnline Action Detectionや弱教師のOffline Action Detection (Temporal Action Localization)は研究されていたものの,Onlineで弱教師のAction Detectionはなかったのでその点が新規性.

結果

THUMOS’14, ActivityNet1.2, ActivityNet1.3で実験し,従来のセグメント単位のアノテーションを利用した手法に匹敵する性能を達成.また,セグメント単位のアノテーションも組み合わせて使うことでSOTAの性能を達成.

その他(なぜ通ったか?等)

動画単位のアノテーションというと1動画に複数の行動ラベルが存在するけど,それをどうやって使っているのかパッと見た限りでは理解できなかった.