#336
summarized by : Yoshiki Nagasaki
SGTR: End-to-End Scene Graph Generation With Transformer

どんな論文か?

画像シーングラフ生成においてDETRを基盤としたEnd-to-Endモデルを構築した論文.
placeholder

新規性

DETRを基盤とすることで画像シーングラフ生成タスクにおいて高精度なEnd-to-Endモデルを構築し, Bipartite Graph Assemblingを導入することによりtwo-stageモデルとone-stageモデルの利点を兼ね備えた手法を提案した.

結果

従来の画像シーングラフ生成モデルと比較してSoTAを達成した.また,定性的に視覚化したattention mapからも,物体と関係性が正確に捉えられていることが分かった.

その他(なぜ通ったか?等)