#356
summarized by : QIU YUE
Semantic Audio-Visual Navigation

どんな論文か?

新しいタスクSemantic Audio-Visual Navigation及びこのタスクのためのデータセット、Transformer構造の手法を提案。
placeholder

新規性

①タスクの新規性。既存のAudio-visual navigationでは、音を出す物体がAgentがナビゲーションするプロセスでずっと音声を発する。ここで、実環境と類似するように、物体がより自然な期間しか音を出さない設定にした。実環境への適応性を向上した。②手法の新規性。強化学習とTransformerを結合したこのタスクのための新たな手法を提案し、SoTAを達成。

結果

既存のAudio-visual navigationデータセットおよび提案のデータセットにおいてSoTAを達成。

その他(なぜ通ったか?等)