#163
summarized by : Naoya Chiba
SeqXY2SeqZ: Structure Learning for 3D Shapes by Sequentially Predicting 1D Occupancy Segments From 2D Coordinates

どんな論文か?

3DでのOccupancyをImplicit Functionを用いて推定する.XY軸についてクエリとしてZ軸についてシーケンスとして扱うSeq2Seqモデルで,占有領域の開始座標・終了座標を推定する.RNNセルとしてGRUと用い,Attention機構を組み込んだネットワークを用いる.メモリ効率がよく,既存手法よりも高い最高性性能を達成.
placeholder

新規性

Occupancyの推定を,X, Yを順にRNNに入力しLatentとして対応する座標についてグリッド上で占有領域がどこであるかの開始・終了を順次出力するという,Seq2Seqの問題設定として捉えて学習した.これにより3Dや2Dの陽な畳み込みは不要となり,Implicit Functionを用いた高解像度な出力を効率よく計算できる.

結果

ShapeNetCoreの5カテゴリを使って評価,既存手法と比較し高い再構成精度を達成.どの軸に沿ってRNNを用いてもそれほど精度に影響がないことを確認した.単眼RGB画像からの三次元形状復元でも検証.

その他(なぜ通ったか?等)