- …
- …
#374
summarized by : Akihiro Yoshida
どんな論文か?
Action Quality Assessmentについて、動画を6分割し、それぞれの特徴抽出を行ったのちに、動画中の行動の評価、行動の分類、キャプション生成の3つのMulti Task Learningに拡張することで、動画中の行動の評価単体のSingle Task Learningに比べて、より汎用的な特徴抽出に成功し、予測精度が向上した。
新規性
Action Quality Assessment(動画から動画中の行動の評価)の問題について、行動評価の値を唯一の目的変数としたSingle Task Learning(STL)が主流であったが、Multi Task Learning(MTL)に拡張した。また、複数の行動の種類の動画に対応が可能になった。
結果
1412の動画を用いて、STL,MTLの行動評価に関する精度比較の結果MTLの精度の方が高精度を達成。既存のモデルと行動評価の相関係数を用いて比較し、提案手法のMTLが高精度を達成。また、それぞれのConvolution層の出力の値を入力とし、行動評価を線形回帰で求めた重みのパラメタより動画全体から満遍なく特徴抽出していることがわかった。
その他(なぜ通ったか?等)
- …
- …