Rethinking Zero-Shot Video Classification: End-to-End Training for Realistic Applications

#402

summarized by : Shuhei M Yoshida

Biagio Brattoli, Joseph Tighe, Fedor Zhdanov, Pietro Perona, Krzysztof Chalupka

どんな論文か？

認識したいクラスの訓練データを持たずに学習するzero-shot学習（ZSL）に関する論文。動画分類のZSLでは、end-to-endに学習可能な方法が存在しなかった点、ZSLとしての適切な評価のプロトコルが確立されていなかった点を取り上げ、これらの問題を解決する。

新規性

従来の動画分類ZSLでは、事前学習した特徴抽出器を与えられたものとして使用していたが、本論文では特徴抽出器も含めて全体をend-to-endで学習できる方法を提案。また、複数の動画分類データセットを組み合わせる際、クラス名は異なるが意味的に同じものを表すものを取り除く方法を提案。これにより、従来のベンチマークで「訓練データを持たない」というZSLの条件が満たされていなかった問題を解消。

結果

提案手法と提案した評価方法で比較したとき、従来の手法に比べて高い精度を達成した。

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．