#250
summarized by : Munetaka Minoguchi
Attentive Relational Networks for Mapping Images to Scene Graphs

どんな論文か?

シーングラフ生成のための,物体検出器を採用し,2つのモジュールからなるAttentive Relational Networkの提案.1つ目は,視覚的特徴と言語的特徴を,共通の空間上に投影できる意味変換モジュール.2つ目は,近隣のノードに重みを設けることでグラフ表現を行うgraph self-attention.最後に関係性を推論するモジュールによって生成する.
placeholder

新規性

画像中の各物体の関係性を示すグラフを作成するタスクであるシーングラフ生成に取り組む論文.物体検出は完成されつつあるが,シーングラフ生成タスクは進んでいないことから,高精度なフレームワークを提案.

結果

Visual Genomeによって提案手法の有効性と優勢を示した.

その他(なぜ通ったか?等)

複数モジュールによる,理にかなった手法の提案と,それに伴った有効性.