- …
- …
#339
summarized by : Akihiro FUJII
どんな論文か?
既存のモデルのスケーリング戦略はflopsと精度の関係に焦点を当てているが、パラメータ数や活性数があるため実行時間は様々であった。幅を主にスケーリングさせることで精度を落とさずに実行時間を短縮できるスケーリング戦略を開発した。
新規性
flopsと精度ではなく、実際の実行時間とスケーリング戦略の観点に焦点を当てた。その結果、深さや解像度よりも幅を中心にスケーリングさせた方が精度の劣化を防いで高速なネットワークを作ることができることを発見した。
結果
ImageNetで精度と速度の関係を検証。深さや解像度を考慮したスケーリング先略と比較し、提案された幅中心のスケーリング戦略が高速かつ精度の劣化が小さいことを確認した。
その他(なぜ通ったか?等)
https://github.com/facebookresearch/pycls
- …
- …