#396
summarized by : Shintaro Yamamoto
End-to-End Human Object Interaction Detection With HOI Transformer

どんな論文か?

人間と物体の関係を記述するHuman Object Interaction(HOI)は,物体検出と関係の推定の2段階に分かれていた.これに対して,HOIをend-to-endでやるTransformerベースの手法を提案.
placeholder

新規性

Encoder-decoder構造のTransformerを導入.Decoderから得られたembeddingを入力とし,関係性及びbounding boxを予測するMLPを構築.

結果

HICO-DETで26.61% AP,V-COCOで52.9 AProleを達成した.

その他(なぜ通ったか?等)

https://github.com/bbepoch/HoiTransformer