#115
summarized by : Takuma Yagi
IRLAS: Inverse Reinforcement Learning for Architecture Search

どんな論文か?

深層学習器における逆強化学習に基づく構造探索手法の提案。
placeholder

新規性

人間がデザインした構造は効率的かつトポロジー的に美しい(!)という前提の元、構造探索問題を人間のデザインした構造をエキスパートとした逆強化学習問題に落とした点。人間が設計したネットワーク構造をソフトな制約として課すmirror stimuli functionの提案。

結果

CIFAR-10、ImageNetにおいてNASNetなどより高精度、高速。探索そのものの安定性も高く、比較的シンプルな構造を発見。

その他(なぜ通ったか?等)

手法そのものはオーソドックスながら発想が斬新で実効性もある。