#604
summarized by : Yusuke Saito
Exploring Data-Efficient 3D Scene Understanding With Contrastive Scene Contexts

どんな論文か?

点群などの3Dシーンデータを収集しアノテーションすることは困難である。3D点群のためのデータ効率の良い学習を目的とし、Pointレベルの対応関係とシーン内の空間的なコンテクストの両方を利用する3D事前学習手法を提案する。
placeholder

新規性

- 実世界の大規模な3Dシーン理解のセットアップにおいて、データ効率の良い学習を検討したこと。 - この研究はPointContrastに触発されたものであるが、ポイントレベルの対応付けにしか関係しておらず、シーン内の空間構成やコンテクストを完全に無視していた。本研究では、空間情報をコントラスト学習フレームワークに統合するアプローチを提案する。

結果

- ScanNetにおいては、0.1%の点群ラベルを用いても、完全なアノテーションを用いた場合のベースライン性能の89%(インスタンス・セグメンテーション)と96%(セマンティック・セグメンテーション)を達成。 - PointContrastと比較して、限定的なアノテーションLAと限定的なシーン再構成LRの二つのシナリオにおいて、mAP(0.5)およびmIoUの指標において性能が向上。

その他(なぜ通ったか?等)

オブジェクトの相対的なポーズやオブジェクト間の距離などを考慮した事前学習手法を提案し、その有効性において複数の評価指標で向上している。