- …
- …
#12
summarized by : Shuhei M Yoshida
どんな論文か?
人物・物体とそれらの間の関係を表すシーングラフを生成する手法。関係性ラベルの出現頻度はlong-tailを持っており、頻出カテゴリーと希少なカテゴリーの間には大きなインバランスがある。このシーングラフ生成におけるlong-tail問題を解消するための方法を提案する。
新規性
推論の信頼度に応じて適応的に推論するconfidence-aware bipartite GNNを提案。
さらに、画像単位のoversamplingとインスタンス単位のundersamplingを行うbi-level data samplingを提案。
結果
提案手法によりシーングラフの生成精度が向上すること、特に低頻度なラベルにおける改善幅が大きいこと、したがってシーングラフのlong-tail問題に対して提案手法が有効であることを、Visual GenomeとOpenImageV4/V6ベンチマークで確認。
その他(なぜ通ったか?等)
シーングラフ生成においてlong-tail問題は定番の問題設定であり、そこにおいて顕著な改善が見られたため採択されたと考えられる。画像単位とインスタンス単位でサンプリング戦略を使い分けるbi-level resamplingの発想は面白く、またこれは確かにlong-tail問題に有効であると思われる。一方、BGNNがlong-tail問題に対してなぜ有効なのかがよくわからなかった。
- …
- …