#28
summarized by : Yuma Ochi
Searching the Deployable Convolution Neural Networks for GPUs

どんな論文か?

推論精度と時間の両方を向上させることを目的とし,NASで探索されたGPUNetというモデルを提案。
placeholder

新規性

従来手法の課題であった,活性化関数,様々なフィルタサイズ,SE層などをパラメータとし,大規模で複雑な探索空間上のNASを実現させた. 2段階プロセスを踏んだ.1. 推論時のレイテンシでモデルを分類, 2. 分類されたレイテンシ内で最も性能の高いモデルをNASで探索,2段階目のNASでは,クライアント・サーバー型の分散処理システムを構築し,並列で高速にネットワークの探索を行った.

結果

ImageNetを使って事前学習→ファインチューニングを行い,推論精度とTensorRTのレイテンシを計測.今までのモデルと比較してより高い性能でより速い推論が実現した(図).さらに物体検知タスクにおいても,従来手法を上回る性能をマークし,汎用的なモデルであることが確認された.

その他(なぜ通ったか?等)