#253
summarized by : Munetaka Minoguchi
On the Intrinsic Dimensionality of Image Representations

どんな論文か?

ロボットアームの学習において,多数の3Dモデルデータを生成し,仮想領域でモデルを学習させ,実世界の画像に適用する手法の提案.キーポイント間の幾何学的な制約を十分に活用した半教師付き学習手法を提案.これにより,実画像に注釈を付けることなく,一般化することが可能.
placeholder

新規性

センサが装備されていない低コストのロボットアームにおいて,3次元姿勢推定のような認識を行うには,多くの学習画像データにアノテーションが必要.本手法によって3Dモデル+仮想領域によってモデルの学習を行うことでこれらの問題を解決する.

結果

2つの実世界におけるデータセットで有効性を検証.また,本手法は3Dモデルのみが必要なだけであるため,他の多剛体動的システムに一般化できる可能性を示唆.

その他(なぜ通ったか?等)