#141
summarized by : Masanori YANO
Learning To Resize Images for Computer Vision Tasks

どんな論文か?

画像の入力を224×224などにリサイズする部分に着目し、リサイズする処理も学習ベースとした手法。
placeholder

新規性

学習ベースでリサイズを行うネットワーク構造を提案した。深層学習モデルの入力として使う前提で、ネットワーク構造の内部にはバイリニア法の処理を組み込んでいる。

結果

ImageNetデータセットで4種類の深層学習モデルの評価を行い、いずれもバイキュービック法でリサイズするより精度が向上する結果。AVAデータセットによる画質の評価でも、同じ解像度でバイキュービック法を上回る結果。

その他(なぜ通ったか?等)

着眼点の良さと、要所を押さえた実験結果により通ったと考えられる。論文の著者による実装ではないが、Keras(tf.keras)のCode Example( https://keras.io/examples/vision/learnable_resizer/ )が公開されている。