3D Shape Generation and Completion Through Point-Voxel Diffusion

#36

summarized by : Naoki Wada

Linqi Zhou, Yilun Du, Jiajun Wu

どんな論文か？

比較的新しい生成モデルであるdiffusion modelにメモリサイズを抑えて3D データを扱えるpoint- voxel cnnを用いて3Dモデルを無条件な生成や一枚絵からの生成、また一部が指定され残りの部分の生成する、補完を行った。diffusionモデルではガウシアンノイズから徐々にデノイジングを行い、（今回では椅子や飛行機のpoint-voxelといった）生成するデータに近づけていく。

新規性

GANやFlow ベースの３D生成モデルは幾つかの研究があるが、比較的新しい生成モデルであるdiffusion modelを用いたところが新規性。無条件の生成だけでなく、視点を固定した二次元の一枚絵からの生成や物体の一部（椅子の足の部分のみやノイジーなデータなど）が与えられ、残りを補完するなど行くつかの新しいタスクも行った。

結果

Chamfer Distance(CD) とEarth Mover's Distance(EMD)によるGANやFlow ベースの既存手法との比較が行われていた。無条件の生成ではCD、EMD共に勝っていた。補完ではCDでは劣っていたがEMDでは勝っていた。これはCDが視覚品質を無視する特性があるためだと考察している。

その他（なぜ通ったか？等）

diffusion modelを使えばGANでできなかったことがいろいろできるようになるんだなと感じた。

このページで利用されている画像は論文から引用しています．