#696
summarized by : Shunsuke NAKATSUKA
The Pros and Cons: Rank-Aware Temporal Attention for Skill Determination in Long Videos

どんな論文か?

2つの動画からどちらの動画のほうが,作業に対して高いスキルを持っているを判定する(Pros and Cons).
placeholder

新規性

NNは4つのLossで最適化される. 1.rankに直結するrank loss. 2.attentionを促進するdisparity loss 3.rank aware loss 4.moduleが様々な動画部分から学習するようにするためのdiversity loss

結果

EPIC-Skills datasetとyoutubeから作成したデータセットで実験.両データセットで従来手法やAttention無しの手法よりも高精度.4つのLossの有効性も結果で確認.

その他(なぜ通ったか?等)