#9
summarized by : Shuhei M Yoshida
Probabilistic Modeling of Semantic Ambiguity for Scene Graph Generation

どんな論文か?

人物・物体とそれらの関係を表現したシーングラフを生成する手法に関する論文。 シーングラフの関係性ラベルには曖昧さがある。しかし、従来手法ではシーングラフを決定論的に生成しており、本来多様な正解がありうることを無視しているという問題がある。そこで、関係性ラベルの分布を推定する方法を提案。
placeholder

新規性

関係性の特徴量を点推定ではなくガウス分布として推定するProbabilistic Uncertainty Moduleを提案。これは、既存のシーングラフ生成モデルの特徴抽出器に挿入して使用することが可能。

結果

既存のシーングラフ生成モデルに挿入することで精度が向上することを実験的に確認した。関係性ラベルの予測結果が多様化した。特に、頻度の少ないラベルに対して精度向上の幅が大きい結果となった。

その他(なぜ通ったか?等)

損失関数(10)の第2項は、曖昧さに応じて予測を多様化させる意図に対して逆効果なのではないか?(だから正則化(12)が必要になったのではないか?)一方で実験結果は良いので、結局何がどういう仕組みで効いたのか、疑問が残る。