#97
summarized by : Ryota Suzuki
Efficient Neural Vision Systems Based on Convolutional Image Acquisition

どんな論文か?

CNNの畳み込みの計算に,光学系も組み込んでしまおうという挑戦.2重レンズ+マスク(spatial light modulator;SLMを使用)で畳み込み層を物理的に実装する.SLMはプログラマブルで,畳み込み層のパラメータ学習が実装できる.
placeholder

新規性

CNNの光学系による物理的実装はCV的かつ斬新.

結果

光学畳み込み1層+処理系MLP5層でEMNIST分類タスクを解いたところ,SoTA手法の数字99.79%/文字95.36%/パラメータ数5.87Mに対し,数字99.43%/文字93.65%/パラメータ数0.55Mと,同程度の性能ながら処理系でのパラメータ数を大幅に減らせた.

その他(なぜ通ったか?等)