#300
summarized by : Masaki Miyamoto
What's to Know? Uncertainty as a Guide to Asking Goal-Oriented Questions

どんな論文か?

視覚的対話タスクの課題の1つとして,要求された目的の達成のために,強化学習におけるエージェントが最も有用な情報を提供するであろう質問を選択するというものがある.本稿では,エージェントにより維持する暗黙モデル,および適切な出力を選択するために使用される関数における不確実性のベイズ推定モデルを用いて,この課題に対する解決案を提案する.
placeholder

新規性

・強化学習モデルの内部表現における不確実性を定量化するためのベイジアン推定ディープラーニング法 ・エージェントが目的を達成するために必要な情報を提供するような質問を積極的に策定する,不確実性を意識した情報探索デコーダ •モデルが正確な出力を生成するのに十分な情報を持っているかどうかを示す尺度として,予測器の信頼性を利用する手法

結果

結果として,本稿の手法とMemory Networkを組み合わせて算出した精度が新しい目標においてはSamplingで68.3%,Greedyで69.2%となり,新しい画像においては,Samplingで66.3%,Greedyで67.1%となった.これは既存手法を超える精度であり,本手法の有効性を確認した.

その他(なぜ通ったか?等)