#45
summarized by : Tong Zheng
Generative Multiplane Images: Making a 2D GAN 3D-Aware

どんな論文か?

GANに生成された顔画像をAlpha Maps(透明度を表すmap)に分解し、Alpha MapsとPose情報を入れて(ここのPoseは顔の向き)違う角度の顔画像を生成する。3D処理を行わず、2DのGANだけで偽3D画像(それぞれのcamera poseが違うから)を生成。
placeholder

新規性

従来の多角度画像生成は3D GANを使うが、本論文は2D GANを使うだけ。顔画像を深度によって幾つか(論文では5枚、つまり最大深度は5で最小深度は1)のalpha mapに分解。一枚のalpha mapは、ある深度で、画像の一個一個画素の透明度を表す。alpha mapによって顔画像を複数深度の画像に分解し、分解された画像にcamera pose情報を入れて、ある角度から見れる顔画像を生成する。

結果

FFHQ、AFHQv2、MetFacesデータセットで多角度顔画像生成のSOTAを実現。一枚の顔画像から複数向きの顔画像生成できた。

その他(なぜ通ったか?等)

2D GANを使うだけで偽3D画像を生成した点が新しい。 https://github.com/apple/ml-gmpi