#699
summarized by : Naoya Chiba
ReAgent: Point Cloud Registration Using Imitation and Reinforcement Learning

どんな論文か?

模倣学習と強化学習を用いた点群位置合わせ手法の提案.姿勢推定の残差を推定して姿勢を更新する点群位置合わせの過程を,現在の状態に対する行動選択を行う問題と読み替えて強化学習の枠組みで定式化する.行動は重心周りの各軸回転と各軸の並進で記述し,それぞれの行動の選択確率をポリシーとして予測する.
placeholder

新規性

反復して位置合わせを行う操作を環境中での行動選択とみなし,強化学習を点群位置合わせに利用するアプローチが新規.入力はPointNetでエンコードし,得られる特徴量からポリシーを推定するよう学習する.さらに真の剛体変換を利用して模倣学習を行うことで初期化・強化学習中にもエキスパートとして損失を計算し教師とする.

結果

ModelNet40で学習・評価,ScanObjectNNの実世界データで評価.提案法はノイズにロバストであり,また未知カテゴリへの対応もできることを示した.

その他(なぜ通ったか?等)