#339
summarized by : Akihiro FUJII
Fast and Accurate Model Scaling

どんな論文か?

既存のモデルのスケーリング戦略はflopsと精度の関係に焦点を当てているが、パラメータ数や活性数があるため実行時間は様々であった。幅を主にスケーリングさせることで精度を落とさずに実行時間を短縮できるスケーリング戦略を開発した。
placeholder

新規性

flopsと精度ではなく、実際の実行時間とスケーリング戦略の観点に焦点を当てた。その結果、深さや解像度よりも幅を中心にスケーリングさせた方が精度の劣化を防いで高速なネットワークを作ることができることを発見した。

結果

ImageNetで精度と速度の関係を検証。深さや解像度を考慮したスケーリング先略と比較し、提案された幅中心のスケーリング戦略が高速かつ精度の劣化が小さいことを確認した。

その他(なぜ通ったか?等)

https://github.com/facebookresearch/pycls