- …
- …
#371
summarized by : Anonymous
どんな論文か?
few shot領域分割用のVolumetric Aggregation with Transformers (VAT) という新しいコスト アグリゲーション ネットワークを提案した.
新規性
1.4D畳み込みSwin Transformerを提案した.
2.粗いレベルでの集約がより細かいレベルでの集約を導くピラミッド構造内にトランスフォーマーを適用することによって集約パフォーマンスを向上させる.
3.transformer出力のノイズは、クエリの外観埋め込みを利用して、後続のデコーダーでフィルター処理される.
結果
このモデルでは、few shot領域分割のすべての標準ベンチマークに新しい最先端技術をもたらした. VAT は語彙対応についても最先端のパフォーマンスを達成することが示されコスト集計も中心的な役割を果たした.
その他(なぜ通ったか?等)
1.4次元のネットを提案することにはかなり新規性がある.
2.few shot領域分割にTransformerを導入するのは面白く,創新的研究である.
3.VATの各部分に対してAblation Studyをし,冗長性を議論し,各部分が精度に寄与していることを示した.
- …
- …