#615
summarized by : Masanori YANO
Revisiting Skeleton-Based Action Recognition

どんな論文か?

動画からの行動認識で、グラフ畳み込みネットワーク(GCN)を使用せず、3次元の畳み込み(3D-CNN)ベースで実現した手法。
placeholder

新規性

姿勢推定の結果を使うスケルトンベースで、2次元の姿勢から3次元のヒートマップを生成し、3D-CNNのネットワーク構造で行動を推定するPoseConv3Dを提案した。

結果

GCNを使用する従来手法と比較評価を行い、PoseConv3Dは6種類のベンチマークのうち5種類で従来手法を上回る結果。また、マルチモーダルで融合させると、8種類のベンチマーク全てで従来手法を上回る結果。

その他(なぜ通ったか?等)

コンセプトを明確に定め、高い認識性能を示したことで通ったと考えられる。MMAction2ベースの実装( https://github.com/open-mmlab/mmaction2 )が公開されている。