#778
summarized by : 福沢栄治
Learning Multi-View Camera Relocalization With Graph Neural Networks

どんな論文か?

自動運転の領域において、カメラの絶対ポーズを推定するために、与えられたシーケンス全体の情報を発掘するビューグラフを作成することを提案しました。具体的には、GNNを利用してグラフをモデル化し、連続していないフレームでも相互に情報を交換できるようにします。
placeholder

新規性

この手法は、通常のGNNを直接採用するのではなく、ノード、エッジを再定義し、設計されたGNNがCNNと協力して、知識の伝播と特徴抽出をそれぞれガイドし、マルチビューの高次元画像特徴をさまざまなレベルで繰り返し処理します。さらに、連続するビュー間の制約を超えた一般的なグラフベースの損失関数が、エンドツーエンドのファッションでネットワークをトレーニングするために使用されます。

結果

ドアと屋外の両方のデータセットで行われた広範な実験は、この手法が大規模で困難なシナリオで特に既存の手法よりも優れていることを示しています。

その他(なぜ通ったか?等)