#850
summarized by : Hiroaki Aizawa
3DV: 3D Dynamic Voxel for Action Recognition in Depth Video

どんな論文か?

人の行動は3次元空間上で行われる故,行動認識においても3次元空間を考慮することが重要である.この研究では,深さに基づいた3次元行動動作認識のための,3次元動作パターンを効果的に表現する3D dymanic voxel (3DV)の提案.3DVは,3Dモーションをエンコードできるだけなく,そのモーションが3次元上のどこに現れるかを示すことができる.
placeholder

新規性

先行研究のdense scene flowやdynamic voxelなどの3次元行動動作認識とは異なり,行動をボクセル化した新たな表現方法の提案.また,この表現をPointNet++で処理するよう工夫することで計算量の削減と学習の困難性を改善した.行動認識には詳細な外観特徴も重要であるのでtwo-stream型の枠組みを提案した.

結果

よく用いられる4つのベンチマークデータを用いた実験を行った.特に,NTU RGB+D 120では,cross-subject, cross-setup test settingで,それぞれ82.4%,93.5%の精度が得られた.先行研究から14.7%, 26.6%改善.

その他(なぜ通ったか?等)