- …
- …
#99
summarized by : Masanori YANO
新規性
特徴抽出を行うエンコーダに加えて、マスクとクラス分類を得るデコーダにもTransformerを適用してセマンティックセグメンテーションを行うSegmenterを提案した。
結果
ImageNet-21k Pre-trainedのViT及びImageNet Pre-trainedのDeiTをバックボーンとして使用し、ADE20K、Pascal Context及びCityscapesのデータセットで評価を行い、CityscapesではDeepLab v3+などを少し下回るが、それ以外は従来手法と同等以上の結果。ADE20Kでは、Swin Transformerを上回る結果。
その他(なぜ通ったか?等)
複数のデータセットで、全般的に良好な実験結果を得ているため通ったと考えられる。PyTorch実装( https://github.com/rstrudel/segmenter )が公開されている。
- …
- …