#634
summarized by : Tomoki Tanimura
Learning in the Frequency Domain

どんな論文か?

既存のDNNによる画像分類では,解像度を特定のサイズに圧縮して学習を行っている.これにより,周波数的に冗長的な特徴と顕在的な特徴の両方が失われており,精度の劣化を招いている.有用な周波数情報の選択を学習する前処理の手法を提案.画像分類とInstance Segmentationでの実験を行い,精度改善示した.
placeholder

新規性

有用な特徴量の選択を,リサイズする前に周波数の選択によって行った.

結果

画像分類 (ImageNet) : +1.60% (ResNet-50), +0.63% (MobileNetV2) Instance Segmentation (COCO) : +0.8% (Mask R-CNN)

その他(なぜ通ったか?等)