#276
summarized by : hisaka koji
VLN BERT: A Recurrent Vision-and-Language BERT for Navigation

どんな論文か?

視覚言語ナビゲーション(VLN)における時間を考慮したリカレントBERTモデル
placeholder

新規性

Vision-and-Language BERT に再帰性を導入し、時間に依存する入力を認識する。

結果

VLNについては、我々の提案する VLN BERT は、BERT 自身をナビゲーターネットワークとして適用し、R2Rおよび REVERIEにおいて SoTA 性能を達成している

その他(なぜ通ったか?等)

https://github.com/YicongHong/Recurrent-VLN-BERT