#484
summarized by : Ryota Nishijima
HetConv: Heterogeneous Kernel-Based Convolutions for Deep CNNs

どんな論文か?

現在モデルを効率化する手法としてpruningとarchitecture searchが用いられている。しかしpruningでは、まずはじめに複雑なモデルを学習させる必要があったり、architecture searchでは探索に膨大な時間がかかったりでコストが高い。そこで本研究では畳み込みカーネルを新たに提案し、モデルに組み込むことでモデルの軽量化を行う。
placeholder

新規性

従来の畳込みでは縦横のサイズが全て等しいフィルタを使用していたが、本研究ではこの一部の縦横サイズを小さくしたhetconvカーネルで代用した。

結果

Cifar-10で学習を行い、従来の軽量化手法と比較して大きく精度を落とすことなく軽量化を行えていることを確認した。

その他(なぜ通ったか?等)