#816
summarized by : Kensho Hara
PaStaNet: Toward Human Activity Knowledge Engine

どんな論文か?

画像から人の行動を理解するimage-based activity understandingにおいて,物体レベルではなくPartレベルで表現 (Human Body Part States (PaSta)) する手法とデータセットを構築.構築したデータセットであるPaStaNetは700万のPartレベルのアノテーションを含む.これらにより再利用性・転移性が高く,かつ解釈性も高い行動認識を実現.
placeholder

新規性

新たな大規模データセットであるPaStaNetの構築.それを利用してPart-levelの意味的な表現を抽出するActivity2Vecと,PaStaに基づいて行動を階層的なグラフ構造で表現し,解釈を可能にするPaSta-Rを提案.

結果

従来使われていたデータセットであるHICOやV-COCOでの性能向上や動画データセットであるAVAを画像レベルで使った際の転移学習で有効性を確認.

その他(なぜ通ったか?等)

Project Page: http://hake-mvig.cn/home/