#7
summarized by : Yue Qiu
ScanRefer: 3D Object Localization in RGB-D Scans using Natural Language

どんな論文か?

3次元のSceneの視覚入力及び物体に関する自然言語から,物体領域をBBOXで検索する3D Object Localizationタスクを提案.提案タスクのための手法とScanNetをベースとした大規模データセットも提案.
placeholder

新規性

①タスクが2次元検出と比べて、かなりRobotics系において実用性が高い;②更にLanguageと絡んで実用性が期待できる;③3次元特徴量とLanguageをうまくモデルでFusionした.

結果

提案のデータセットでSOTAな2D手法と比べ、精度が高かった. (9.04 ACC vs. 22.39 ACC)

その他(なぜ通ったか?等)

Matterport3Dデータセットを提案した研究室で,3DCNNや3次元認識にかなり強い.提案のデータセット、手法がかなり理解しやすくて、きれい.