#42
summarized by : Akihiro FUJII
Involution: Inverting the Inherence of Convolution for Visual Recognition

どんな論文か?

チャネル毎の各画素に固定値のフィルタをかける畳み込みとは異なり、画素毎に異なる値を割り当てチャネル間で値を共有するInvolutionを提案。畳み込みとは逆の操作で自己注意の一種と考えられる、畳み込みとは異なり初期から広範の視野をもつ。画像分類、物体検知、セグメンテーションで性能向上を確認した。
placeholder

新規性

畳み込みと逆の操作のInvolusionを提案したところ。構造としては自己注意に近く、画素毎に異なる値を持たせつつ、それをチャネル間で共有する。チャネルが自己注意におけるdimsにあたる。(Algolithm1参照)

結果

画像分類、物体検知、セグメンテーションで性能向上を確認した。

その他(なぜ通ったか?等)

新規構造を提案したという意味合いより、畳み込みと自己注意の関係性を明らかにすることが著者の意図に近いように思える。著者によると、自己注意が素晴らしいと再確認したとのこと。