#469
summarized by : shirouchi satoshi
How to Make a Pizza: Learning a Compositional Layer-Based GAN Model

どんな論文か?

ピザの画像からピザの作り方を生成。ピザトッピングをセグメント化して、トッピングの順序を教師なしで推定する。
placeholder

新規性

GANのDecoderはトッピングを追加、除去した後の形を推定するmask M layer、色をつけるappearance A layerを持つ。トッピングの順序付けは、トッピングを除去するときの除去される割合が大きいものほど上にトッピングされているとすることで、教師なしで順序まで推定できる。

結果

トッピングの分類はResNetを使ったCNNが99.3% mAPに対し、提案手法は99.9% mAP。トッピングの順序付けはPizzaGanだとaverage normalized DL distanceが0.33、ランダムの場合、0.91。

その他(なぜ通ったか?等)