- …
- …
#620
summarized by : 古澤嘉久
どんな論文か?
画像に対する反実仮想説明を生成する研究。これまでの研究は画像一枚に対して最適化を行う必要があり、応用面を考えると非常にコストがかかっていた。また、生成される解像度にも限界があったが、大規模モデルで学習済みの生成モデルを併用できるようになったため、高解像度の画像を生成することもできるようになった。さらに既存の定量的な評価指標が入力画像のスコアのみに依存していることを指摘した新たな評価指標も提案した。
新規性
どんな識別器に対しても、一枚に対してインタラクティブに反実仮想画像を生成するようなモデルを学習する方法を提案した。GANのような学習を用いることで、データの分布から外れないようにかつ、事前学習済みのモデルもそのまま利用することができるようにしている。cycle-consistency lossやproximity loss(入力画像が一部異なるように調整)を導入することでより効率的に学習ができる。
結果
本研究でCOUTという新たな指標を提案して、入力画像に対する指標だけでなく、変化後の画像の予測確率をもとに評価を行った。また、Validity(変換後の画像の予測確率)とProximity(元の画像からどれくらい離れているか)を評価することで、なるべく少ない変化で効果的な手法を評価するための指標を提案している。いずれの方法でもSOTAだった。
その他(なぜ通ったか?等)
- …
- …