#75
summarized by : 岡本大和(LINE Computer Vision Lab)
ObjectFormer for Image Manipulation Detection and Localization

どんな論文か?

画像を入力すると、画像加工の有無判定と加工領域の特定をするネットワークを提案
placeholder

新規性

RGB画像に加えてhigh pass filterで変換した画像も入力に利用した。 モデルアーキテクチャはAtteniton機構を取り入れた。

結果

Manipulation Detectionのタスクで従来手法よりも高性能を達成。

その他(なぜ通ったか?等)

モデルアーキテクチャのアップデート(EfficientNet-b4がベースライン → Atteniton導入)による貢献が大きい。一方で、high pass filterで変換した画像の入力がどれだけ性能向上に貢献したのか懐疑的(この点はAbulation Studyでもインパクトある結果には見えなかった)。