Large-Scale Localization Datasets in Crowded Indoor Spaces

#670

summarized by : Yusuke Saito

Donghwan Lee, Soohyun Ryu, Suyong Yeon, Yonghan Lee, Deokhwa Kim, Cheolho Han, Yohann Cabon, Philippe Weinzaepfel, Nicolas Guérin, Gabriela Csurka, Martin Humenberger

どんな論文か？

画像を用いたローカライズのための既存の屋内データセットは、アノテーションが非常に難しく、また一部の領域したカバーしていない。本論文では、10台のカメラと2台のレーザースキャナからなる専用のマッピングプラットフォームを用いて撮影したデータセットを提案する。その際、LiDAR SLAMとSFMの両方のアルゴリズムを利用した新しい自動化パイプラインを開発した。

新規性

- Stanford、Scan-Net、Matterport3Dなどの一般的な屋内データセットは、データベースとクエリの分割は行われていない。 - よりローカリゼーションに特化したデータセットでさえ、比較的狭い屋内空間で撮影されている - 提案するデータセットは、非常にダイナミックで混雑した屋内空間で撮影されており、また営業時間中の撮影のため混雑度が考慮されている。

結果

- 提案したデータセットを用いて，最先端の視覚情報化アルゴリズムのベンチマークを行った．構造ベースの手法は座標点回帰を有意に上回り、一方シーンポイント回帰の方法は性能が低いものとなった。 - 混雑度の分析ではDELG+R2D2を用いた。最も混雑していた地下鉄駅B1では、性能が9%低下していた。それでも構造ベースの手法の性能は非常に高く、約50％の画像が誤差25cmと2◦以内となった。

その他（なぜ通ったか？等）

- ローカライズ用データセットにおいて、限定的な範囲ではなく、地下鉄のフロア全体を網羅するような範囲におけるデータセットを提供したこと。さらに、LIDARのSLAMシステムを工夫していて、高密度で正確なラベル付けがなされている。 - また撮影時間帯を混雑した時間帯も含めて撮影されている点も、実アプリケーションへの適用が考慮されている。

このページで利用されている画像は論文から引用しています．