#392
summarized by : Masaki Taniguchi
Attention-Guided Hierarchical Structure Aggregation for Image Matting

どんな論文か?

写真から被写体を抽出するAlpha Mattingタスクに取り組む。本研究の貢献は以下である。1. ユーザーによる追加入力なしに抽出できる手法を提案。2. 1.のための細かい外見的特徴と高度な意味的特徴をどちらも捉えるための階層的なattention機構を提案。3. 学習のための3要因を組み合わせた損失関数を提案。4. 60,600枚からなるこの分野において最大のデータセットを作成。
placeholder

新規性

このタスクでは被写体の特定とそれの正確な分離という2つの要素があり、それぞれ高次の抽象的な意味情報と低次の細部特徴が密接に関わっている。既存手法ではユーザーからの追加入力で被写体を特定し、低次の情報を用いるモデルで被写体を正確に分離するというものが多かったが、本稿では両方の特徴量を捉えるための階層的なattention機構を提案し、ユーザの追加入力に頼らない手法を実現した。

結果

ユーザーによる写真以外の追加入力無しで、追加入力ありで行う手法のSOTAに迫る正確な前景抽出を可能にした。

その他(なぜ通ったか?等)

写真のみからの正確なalpha mattingに成功している点と、この分野における最大のデータセットを作成した点。