#4
summarized by : Teppei Kurita
Wavelet Integrated CNNs for Noise-Robust Image Classification

どんな論文か?

CNNのMaxPoolingとConvolutionを離散ウェーブレット変換に置換することで性能を向上させる。Poolingでのダウンサンプリングの際に高周波と低周波に分解して、推論時に高周波のノイズを除去することでノイズ耐性が上がる。基底はHaar等のシンプルなものでも良い。
placeholder

新規性

MaxPoolingはNNの標準的なダウンサンプリングだが、画像の細かい構造を簡単に破壊してしまうところに注目し、ウェーブレット変換して周波数帯域で慎重に信号を扱って特徴抽出した方が良いということを示したのがキモ。綺麗な低周波の信号から特徴を丁寧に抽出するのが大事。

結果

ImageNetでの評価で、ウェーブレットを使用しないベースラインのネットワーク(VGG、ResNet、DenseNet)よりも性能が向上することを確認。

その他(なぜ通ったか?等)

発想はシンプルなので既存研究でもウェーブレットをNNに組み込むというのは色々あったが、いずれも基底関数を限定していたりして、アドホックな対応だった。この研究では設計に汎用性をもたせているのが進歩性の1つ。