- …
- …
#371
summarized by : Mitani Tomohiro
どんな論文か?
いままでは監視カメラ映像からの以上検出にはpixel baseの手法が主流だったが、人の行動に注目して骨格検出モデルとRNNによるencoder-decoder modelを組み合わせることで、異常な行動に特化したモデルを構築した。精度は先行研究に劣らず、説明可能性は優れている。
新規性
骨格の動きを、体全体の動きと、局所的な姿勢の2つに分けて二列のRNNに入力する、Message-Passing Encoder-Decorder Recurrent NN(MPED-RNN)で学習した。
結果
ShanghaiTech Campus DatasetおよびCHUK Avenue datasetという2つの動画異常検知データセットに対する検証では、精度はsota同等で解釈性の高いモデルが得られた。
その他(なぜ通ったか?等)
個々の要素としての新規性というよりは、骨格モデルをこのタスクに適用した点と骨格モデルを全体の動きと局所の姿勢に分割した部分か。骨格モデルというかなり構造化されて圧縮された特徴量が、pixelデータを利用したモデルと同等の検出精度を持つ点は興味深い。
- …
- …