#36
summarized by : Naoki Wada
3D Shape Generation and Completion Through Point-Voxel Diffusion

どんな論文か?

比較的新しい生成モデルであるdiffusion modelにメモリサイズを抑えて3D データを扱えるpoint- voxel cnnを用いて3Dモデルを無条件な生成や一枚絵からの生成、また一部が指定され残りの部分の生成する、補完を行った。diffusionモデルではガウシアンノイズから徐々にデノイジングを行い、(今回では椅子や飛行機のpoint-voxelといった)生成するデータに近づけていく。
placeholder

新規性

GANやFlow ベースの3D生成モデルは幾つかの研究があるが、比較的新しい生成モデルであるdiffusion modelを用いたところが新規性。無条件の生成だけでなく、視点を固定した二次元の一枚絵からの生成や物体の一部(椅子の足の部分のみやノイジーなデータなど)が与えられ、残りを補完するなど行くつかの新しいタスクも行った。

結果

Chamfer Distance(CD) とEarth Mover's Distance(EMD)によるGANやFlow ベースの既存手法との比較が行われていた。無条件の生成ではCD、EMD共に勝っていた。補完ではCDでは劣っていたがEMDでは勝っていた。これはCDが視覚品質を無視する特性があるためだと考察している。

その他(なぜ通ったか?等)

diffusion modelを使えばGANでできなかったことがいろいろできるようになるんだなと感じた。