#639
summarized by : Akihiro Matsufuji
Sim-To-Real via Sim-To-Sim: Data-Efficient Robotic Grasping via Randomized-To-Canonical Adaptation Networks

どんな論文か?

強化学習によるロボットアームのObject Graspingに関する研究
placeholder

新規性

強化学習中に行われるドメインランダマイゼーションの弱点を克服に着目して精度の向上を実現. 従来の弱点:ランダマイズされた入力値への汎化とタスクの学習を同時に行う必要があった. 本手法:二つの工程に分離(ランダマイズ画像から画像へと変換+画像から行動への変換)

結果

追加学習なしで70%, 追加学習ありだと94%という高精度を達成した.

その他(なぜ通ったか?等)

工程の分離という新規アイデア+それぞれの工程の実現において最新の従来手法を取り入れているため,隙がない. 結果としても従来手法に比べ精度が良いため.