#492
summarized by : Yoshiki Nagasaki
Structured Sparse R-CNN for Direct Scene Graph Generation

どんな論文か?

シーングラフ生成を集合予測として捉えることで,シンプルでーすパースな統一的フレームワーク(Structured Sparse R-CNN)を提案.
placeholder

新規性

従来研究では多段階パイプラインでシーングラフを予測することが多かったが,シーングラフを構成するsubject-predicate-objectを予測するためのtriplet queryを用いて画像ないからtripletを検出することでend-to-endなシーングラフ生成フレームワークを提案.

結果

Visual GenomeとOpen Image V4/V6データセットに置いて,シーングラフ生成におけるSoTAを達成.

その他(なぜ通ったか?等)

https://github.com/MCGNJU/Structured-Sparse-RCNN