- …
- …
#168
summarized by : 朝岡忠
新規性
よりロバストな3次元特徴を学習するために,言語駆動型の事前学習法を提案.本手法では,言語画像モデル(CLIP)を用いて,「3次元特徴」と「3次元特徴の意味ラベルのテキスト埋め込み」との距離が潜在空間において小さくなるように3次元特徴を学習.
結果
ScanNet200データセットにおいて,3次元セマンティックセグメンテーションにおける最新の3次元事前学習を上回る性能を示した(相対mIoU +9%).
その他(なぜ通ったか?等)
https://rozdavid.github.io/scannet200
- …
- …