#583
summarized by : 志田遥飛
MatteFormer: Transformer-Based Image Matting via Prior-Tokens

どんな論文か?

MatteFormer,画像マット処理タスクにおける最初のTransformerベースのアーキテクチャを提案.提案手法は,PAST(Prior - Attentive Swin Transformer)ブロックを用いたシンプルかつ効果的なモデルである.本アーキテクチャは提案手法を,2つのデータセット(で評価,既存のモデルに大きく差をつけて最先端の性能を達成することを示した.
placeholder

新規性

画像マット処理タスクに特化した,Transformerベースのアーキテクチャ,MatteFormerを新しく提案したこと.本論文ではは既存手法が「CNNをベースにユーザーからの入力を処理」するのに対して,昨今のTransformerの活躍を着想としTransformerを用いたアーキテクチャを提案した.

結果

2つのデータセット(Composition-1KとDistinitions-646)で評価,他のモデルに大きく差をつけて最先端の性能を達成.添付画像では,Composition-1Kを用いた既存手法と提案手法の性能比較実験を紹介する.

その他(なぜ通ったか?等)

【Github link】 https://github.com/webtoon/matteformer.