#168
summarized by : 朝岡忠
Language-Grounded Indoor 3D Semantic Segmentation in the Wild

どんな論文か?

従来よりも一桁多い200クラスカテゴリを持つScanNet200データセットを用いた3次元セマンティックセグメンテーションが研究課題.
placeholder

新規性

よりロバストな3次元特徴を学習するために,言語駆動型の事前学習法を提案.本手法では,言語画像モデル(CLIP)を用いて,「3次元特徴」と「3次元特徴の意味ラベルのテキスト埋め込み」との距離が潜在空間において小さくなるように3次元特徴を学習.

結果

ScanNet200データセットにおいて,3次元セマンティックセグメンテーションにおける最新の3次元事前学習を上回る性能を示した(相対mIoU +9%).

その他(なぜ通ったか?等)

https://rozdavid.github.io/scannet200