#785
summarized by : QIUYUE
Learning to Learn How to Learn: Self-Adaptive Visual Navigation Using Meta-Learning

どんな論文か?

VLNタスクではUnseen Scenesへの汎用性が重要視されている.Unseen Sceneに対しての適応性を高めるため,Meta LearningをVLNタスクに導入した.提案手法SAVNは新たなSelf-supervised interaction lossを導入し,テスト時にもナビゲーションを行いながらこのロスを計算し,Networkの更新を行うことで,Unseen環境への対応を行う.
placeholder

新規性

Meta-reinforcement learningをVLNタスクに導入し,Unseen環境への適応性を高めた.

結果

提案のSAVN手法はAI2-THORデータセットにおいて,Non-adaptiveベース手法と比べ,Successful RateとSPL(Success weighted by Path Length)両方大幅に向上できた.実験を通して提案のLearned interaction lossがhand-crafted lossより良いことを示した.

その他(なぜ通ったか?等)

Reinforcement LearningがVLNタスクの応用が基本構造くらいなっているが,Meta Learningと組み合わせるのが斬新な提案.自己ナビタスクでMeta Learningを使うのもなかなかセンスがある.また,提案のMeta-reinforcement手法をほかの汎用性が重要視されるタスクへの導入も可能.