Segmenter: Transformer for Semantic Segmentation

#99

summarized by : Masanori YANO

Robin Strudel, Ricardo Garcia, Ivan Laptev, Cordelia Schmid

どんな論文か？

畳み込みを使用せず、Transformerベースで実装したセマンティックセグメンテーションの手法。

新規性

特徴抽出を行うエンコーダに加えて、マスクとクラス分類を得るデコーダにもTransformerを適用してセマンティックセグメンテーションを行うSegmenterを提案した。

結果

ImageNet-21k Pre-trainedのViT及びImageNet Pre-trainedのDeiTをバックボーンとして使用し、ADE20K、Pascal Context及びCityscapesのデータセットで評価を行い、CityscapesではDeepLab v3+などを少し下回るが、それ以外は従来手法と同等以上の結果。ADE20Kでは、Swin Transformerを上回る結果。

その他（なぜ通ったか？等）

複数のデータセットで、全般的に良好な実験結果を得ているため通ったと考えられる。PyTorch実装( https://github.com/rstrudel/segmenter )が公開されている。

このページで利用されている画像は論文から引用しています．