#99
summarized by : Masanori YANO
Segmenter: Transformer for Semantic Segmentation

どんな論文か?

畳み込みを使用せず、Transformerベースで実装したセマンティックセグメンテーションの手法。
placeholder

新規性

特徴抽出を行うエンコーダに加えて、マスクとクラス分類を得るデコーダにもTransformerを適用してセマンティックセグメンテーションを行うSegmenterを提案した。

結果

ImageNet-21k Pre-trainedのViT及びImageNet Pre-trainedのDeiTをバックボーンとして使用し、ADE20K、Pascal Context及びCityscapesのデータセットで評価を行い、CityscapesではDeepLab v3+などを少し下回るが、それ以外は従来手法と同等以上の結果。ADE20Kでは、Swin Transformerを上回る結果。

その他(なぜ通ったか?等)

複数のデータセットで、全般的に良好な実験結果を得ているため通ったと考えられる。PyTorch実装( https://github.com/rstrudel/segmenter )が公開されている。