VSGNet: Spatial Attention Network for Detecting Human Object Interactions Using Graph Convolutions

#857

summarized by : Shintaro Yamamoto

Oytun Ulutan, A S M Iftekhar, B. S. Manjunath

入力画像中の人物と物体の関係性を抜き出すHuman-Object Interactionに関する研究。従来手法が検出された人物や物体を独立して扱っていたのに対し、空間上の関係性を見ることで特徴量をリファインする。

人物と物体の関係性を考慮した特徴表現であるSpatial Attention Featureを導入。また、人物と物体の関係性をグラフとして表現し、graph convolutionsにより処理する。

V-COCOとHICO-DETの2つのデータセットで実験を行い、それぞれ8%と16%の精度向上を実現。

このページで利用されている画像は論文から引用しています．