#857
summarized by : Shintaro Yamamoto
VSGNet: Spatial Attention Network for Detecting Human Object Interactions Using Graph Convolutions

どんな論文か?

入力画像中の人物と物体の関係性を抜き出すHuman-Object Interactionに関する研究。従来手法が検出された人物や物体を独立して扱っていたのに対し、空間上の関係性を見ることで特徴量をリファインする。
placeholder

新規性

人物と物体の関係性を考慮した特徴表現であるSpatial Attention Featureを導入。また、人物と物体の関係性をグラフとして表現し、graph convolutionsにより処理する。

結果

V-COCOとHICO-DETの2つのデータセットで実験を行い、それぞれ8%と16%の精度向上を実現。

その他(なぜ通ったか?等)