#122
summarized by : Shuhei M. Yoshida
Hybrid Relation Guided Set Matching for Few-Shot Action Recognition

どんな論文か?

Few-shot行動認識の論文。先行研究には、(a) 動画ごとに独立に特徴抽出しており、タスクに含まれる動画間の関係性を考慮していない、(b) クエリ動画と訓練データに含まれる動画の間で類似性を計算する際、フレームの時間的な順序や位置の整合性に基づいて行うが、時間的整合性の悪いタスクでは分類精度が悪くなる、という問題がある。
placeholder

新規性

動画内、動画間の関係性をモデル化するhybrid relation moduleと、クエリ動画と訓練動画の類似性を特徴量の集合としての類似性として測るset matching metricを導入。前者は(a)の問題に、後者は(b)の問題に対処する。

結果

Few-shot行動認識の代表的なベンチマークデータであるKinetics, SSv2-Full, SSv2-Small, HMDB51, UCF101, Epic-kitchensで評価し、ほとんどの設定で従来のSOTAであるTRXを超える性能を発揮した。

その他(なぜ通ったか?等)