- …
- …
#466
summarized by : 日坂 幸次
どんな論文か?
オブジェクト、属性、関係性の3種類の抽象的なノードからなる有向グラフ
(抽象シーングラフ:Abstract Scene Graph: ASG)を使用することで、画像から、何をどのように表現するか、ユーザーが欲しい多様な説明文を出力させることができる。
新規性
画像キャプション生成のための抽象シーングラフ(ASG)を初めて提唱。
結果
本モデルは、2つのデータセット(Visual Genome, MS COCO)において、ユーザが希望するASGを条件として、最先端の制御性を実現している。また、自動的にサンプリングされたASGに対して、キャプションの多様性を大幅に向上させることができる。
その他(なぜ通ったか?等)
- …
- …