#420
summarized by : kubo.takahiro
Social Relation Recognition From Videos via Multi-Scale Spatial-Temporal Reasoning

どんな論文か?

動画から人間関係/人間と物の関係を推定する手法の提案。既存の手法は画像からがメインだったが、動画を使うことで人の行動などより関係性を推定する手がかりを得ることができる。動画フレームを同一人物・人物間・人/物体間の関係を推定するGraph Netにまず通し、長期の関係を捉えるためGraph Netにさらに通す。最終的に動画全体の特徴と合わせて関係を予測する。
placeholder

新規性

関係予測に、画像でなく動画を使用した点。また、Graph Netを用いて空間的にも時系列的にもロバストなネットワークを構築した点。

結果

空間的特徴だけでなく時系列的特徴を用い関係性の推定に成功した。

その他(なぜ通ったか?等)