#198
summarized by : Yue Qiu
Vision-Dialog Navigation by Exploring Cross-Modal Memory

どんな論文か?

Vision-Dialog Navigationタスクのための新たなモデルCross-modal memory networkの提案.提案モデルは①Language memory module; ②Visual memory moduleを用いて,現在のSentenceと過去の会話履歴、現在の画像と過去のNavigation actionsを関連付け、既存手法より良い性能を得られた.
placeholder

新規性

①languageと visualのco-attentionメカニズムをVision-Dialog Navigationタスクに適応した.②cross-modal memoryモジュールの提案.

結果

Vision-Dialog Navigationタスク用のデータセットCVDN (Cooperative Vision-and-Dialog Navigation)においてseen, unseen設定両方においてSOTAな精度を達成.

その他(なぜ通ったか?等)

Vision-Dialog Navigationタスクはまたやっている人が少なく,ライバルが少ない.