#143
summarized by : Yue Qiu
Iterative Context-Aware Graph Inference for Visual Dialog

どんな論文か?

Graph NNベースなVisual Dialog手法を提案.Visual Dialogを解くプロセスに必要なVisual情報とSemantic情報のRelationshipをGNNによりモデリング.構造:① objectとDialog-historyからGraphを構築;②Top-k 関係推定によりDynamicでGraphを更新;③Graph attention embedding.
placeholder

新規性

①visual dialogに必要なvisual objects, dialog history関の関係性をGNNにより動的に更新,モデリング;②Top-k message passing mechnismとGraph attentionを導入し,モデルの推定プロセスがより解釈可能になる.

結果

Visual Dialog dataset: VisDial v0.9, v1.0においてSOTAな精度を達成;さらに,GraphのAttentionを可視化することにより、従来の手法より解釈性が高い.

その他(なぜ通ったか?等)

①VisualとDialog-historyの関係性をモデリングするところが重要;②モデルの解釈性が高い.