#44
summarized by : Teppei Kurita
PIPAL: a Large-Scale Image Quality Assessment Dataset for Perceptual Image Restoration

どんな論文か?

最近は画質評価基準としてPSNR等よりも優れた知覚基準が提案されてきたが、本当にGAN等で生成された画像の復元品質をちゃんと評価できているのか?という疑問に対して、データセットを新たに生成することで解決を試みた。
placeholder

新規性

GANで生成された画像等多種多様な歪みを含む画像と人的評価がアノテートされたデータセットを生成。113万以上の人間の判定結果を統計的に質が担保された方法で収集。

結果

既存の画質評価手法では、特にGANで生成された画像の品質を公平に評価できていないことがわかった。これはつまり従来のGANベースの復元(SR)アルゴリズムの研究の結論(有効性)にいくつか疑いがかけられることを示唆している。

その他(なぜ通ったか?等)

問題提起がわかりやすく、データセット生成の方針もロジカル。著者はタスクやアルゴリズムの発展に伴って評価手法も更新すべきであると提言している。