- …
- …
#576
summarized by : Eisuke Yamagata
どんな論文か?
顔の画像から年齢推定を行う計算コストとモデルのサイズを削減した新しいモデル(C3AE)の提案。MobileNets/ShuffleNetsとVggNetそれぞれと比べ、1/9と1/2000のパラメータ数。
新規性
depth-wise convolutionの代わりにstandard convolutionを使用した、フルモデル0.25MBのモデルを提案。ネットワークのチャンネル数やパラメータ数を減らすために入力画像のスケールを小さくしている。
結果
IMDB-WIKI、MorphII、FG-NETの三つのデータセットでの年齢推定タスクでMobileNetsやShuffleNetsなどの比較的小さなモデルに対しSOTA達成かつ、メモリサイズも最小、run-time最速。比較的大規模なモデルの一部にMAE約0.5の差で劣る結果。
その他(なぜ通ったか?等)
携帯機器への実装を想定したモデルの小型化の実用性。チャンネル数、depth-wise convolutionとsmall-scale画像の関係性の調査。
- …
- …