#241
summarized by : Shoma Iwai
Image Super-Resolution With Non-Local Sparse Attention

どんな論文か?

Non-Local Attention(NLA)にスパース性を強制するNon-Local Sparse Attention(NLSA)を提案し,単眼超解像の精度を向上させた.通常のNLAでは不要な部分を参照するリスクがあった.そこで,NLSAでは類似しているピクセルごとにグループ分けを行い,グループ内でAttention計算を行う.これにより,計算コストを抑えつつ性能の改善に成功した
placeholder

新規性

- NLAにスパース性を導入することでノイズ等の不要な情報に注目するリスクを防ぐ - Locality Sensitive Hashingによってグループ分けの計算コストを抑えることができる.提案手法では特徴ピクセルを超球面上に射影し,角度の距離を使ってグループ分けを行っている. - シンプルなResNetベースのバックボーンにNLSAを適用することで,多くのデータセットでSOTAを達成した

結果

- Set5, Set14, B100, Urban100, Manga109について,x2~x4のスケールでSOTAを達成 - 1グループに含まれるピクセル数の最適値を調査.多すぎても少なすぎてもダメで,10^2ピクセル程度が最適という結果になった - 計算コストについても既存手法と比較.提案手法は通常のNLAの1/3程度の計算量だが,PSNRでNLAベースの手法を上回った

その他(なぜ通ったか?等)