#132
summarized by : Keisuke Kamahori
AutoSTR: Efficient Backbone Search for Scene Text Recognition

どんな論文か?

Scene Text Recognition (STR) のタスクにおいて、画像から特徴抽出を行う畳み込み層の構造に関する研究はこれまであまりされてこなかった。そこで Neural Architecture Search (NAS) の手法を導入して、このタスクに適したデータ依存のネットワークの構築を行った。
placeholder

新規性

STR に NAS を用いることを初めて試み、STR に適した探索空間と探索戦略を設計した。この探索戦略ではダウンサンプリングと畳み込み操作を分けて最適化したのち、モデルの効率性を保つための正則化項を加える。

結果

提案手法はデータ依存のネットワークを構築でき、複数のベンチマークで SOTA を達成した。また、計算量の効率性とパラメータの少なさにおいて、他手法より優れていた。

その他(なぜ通ったか?等)

https://github.com/AutoML-4Paradigm/AutoSTR