#658
summarized by : Anonymous
Dynamic Hierarchical Mimicking Towards Consistent Optimization Objectives

どんな論文か?

CNNは層が深くなっている一方、最終層の分類器のみに教師強制しバックプロぱゲーションをする方法が、依然として主流である。しかしこのような手法は、階層的な表現生成や矛盾する目的関数をするには適さない。そこで、ネットワーク中の層から動的に分岐点させ最終層に渡す手法を提案している。
placeholder

新規性

残差ネットワークではなく、ネットワークに動的に分岐点を作り最終層に流すアーキテクチャを構築した。

結果

精度だけでなく、様々な画像タスクにおける汎化性能の向上につながった。

その他(なぜ通ったか?等)