#402
summarized by : Shuhei M Yoshida
Rethinking Zero-Shot Video Classification: End-to-End Training for Realistic Applications

どんな論文か?

認識したいクラスの訓練データを持たずに学習するzero-shot学習(ZSL)に関する論文。動画分類のZSLでは、end-to-endに学習可能な方法が存在しなかった点、ZSLとしての適切な評価のプロトコルが確立されていなかった点を取り上げ、これらの問題を解決する。
placeholder

新規性

従来の動画分類ZSLでは、事前学習した特徴抽出器を与えられたものとして使用していたが、本論文では特徴抽出器も含めて全体をend-to-endで学習できる方法を提案。また、複数の動画分類データセットを組み合わせる際、クラス名は異なるが意味的に同じものを表すものを取り除く方法を提案。これにより、従来のベンチマークで「訓練データを持たない」というZSLの条件が満たされていなかった問題を解消。

結果

提案手法と提案した評価方法で比較したとき、従来の手法に比べて高い精度を達成した。

その他(なぜ通ったか?等)