#12
summarized by : Shuhei M Yoshida
Bipartite Graph Network With Adaptive Message Passing for Unbiased Scene Graph Generation

どんな論文か?

人物・物体とそれらの間の関係を表すシーングラフを生成する手法。関係性ラベルの出現頻度はlong-tailを持っており、頻出カテゴリーと希少なカテゴリーの間には大きなインバランスがある。このシーングラフ生成におけるlong-tail問題を解消するための方法を提案する。
placeholder

新規性

推論の信頼度に応じて適応的に推論するconfidence-aware bipartite GNNを提案。 さらに、画像単位のoversamplingとインスタンス単位のundersamplingを行うbi-level data samplingを提案。

結果

提案手法によりシーングラフの生成精度が向上すること、特に低頻度なラベルにおける改善幅が大きいこと、したがってシーングラフのlong-tail問題に対して提案手法が有効であることを、Visual GenomeとOpenImageV4/V6ベンチマークで確認。

その他(なぜ通ったか?等)

シーングラフ生成においてlong-tail問題は定番の問題設定であり、そこにおいて顕著な改善が見られたため採択されたと考えられる。画像単位とインスタンス単位でサンプリング戦略を使い分けるbi-level resamplingの発想は面白く、またこれは確かにlong-tail問題に有効であると思われる。一方、BGNNがlong-tail問題に対してなぜ有効なのかがよくわからなかった。