Detecting Human-Object Relationships in Videos

#200

summarized by : Anonymous

Jingwei Ji, Rishi Desai, Juan Carlos Niebles

Human-Object Relationship Detectionのタスクにおいて，マルチビューの画像に対して物体，物体間の関係性，人物姿勢の時空間的な推論を行う．

静的画像のみを用いた空間方向の補足だけでなく，時間方向の特徴量を捉える．

マルチビューの画像に対して物体，物体間の関係性，人物姿勢の特徴量を抽出することができるIntra and Inter Transformersを提案することで，時空間的な特徴量を学習することに成功した．

このページで利用されている画像は論文から引用しています．