#329
summarized by : Naoya Chiba
MeshMAE: Masked Autoencoders for 3D Mesh Data Analysis

どんな論文か?

Transformerを用いたMeshのエンコーダーと,自己教師学習によるエンコーダーの事前学習手法MeshMAEの提案.メッシュをパッチに分割してそれぞれを埋め込みに変換し,各パッチの中心によるPositional Embeddingsと合わせてTransformerでエンコード,いくつかマスクしてからデコードし再構成することで事前学習する.
placeholder

新規性

Transformerを用いたMasked Autoencoderのアイデアをメッシュのエンコーダーとその事前学習に適用した点が新規.SubdivNetを用いてメッシュの特徴量を記述・集約しパッチとしてTransformerに入力,マスクされたパッチの集合から形状全体を再構成するように学習する.

結果

ModelNet40とShapeNetで事前学習しManifold40のクラス分類・ Human BodyとCOSEG-aliensのパーツセグメンテーションで検証.事前学習によりクラス分類については明確に軽脳が向上し,パーツセグメンテーションではそれほどではなかった.

その他(なぜ通ったか?等)