summarized by : Shunsuke Nakatsuka
Jean-Baptiste Cordonnier, Aravindh Mahendran, Alexey Dosovitskiy, Dirk Weissenborn, Jakob Uszkoreit, Thomas Unterthiner
高解像度の画像から分類するうえで重要なPatchを抽出する枠組み.
分可能なtop-kによりpatch selectionをし,patchから抽出された特徴をtransformerを使ってaggregateする.
従来手法であるattentionを用いた手法より高精度に分類可能.