#85
summarized by : Takeru Endo
UTC: A Unified Transformer With Inter-Task Contrastive Learning for Visual Dialog

どんな論文か?

Visual Dialogタスクにおいて、回答のランク付けと回答の生成という二つのアプローチがあった。本研究では、これらを共同で学習する(Contrastive Learning)ことで、それぞれの回答の精度を向上させている。
placeholder

新規性

二つのアプローチに対して共同で学習した研究はこれまでなかった。

結果

識別タスクと生成タスクの両方において、既存手法の精度を上回った。

その他(なぜ通ったか?等)