Sim-To-Real via Sim-To-Sim: Data-Efficient Robotic Grasping via Randomized-To-Canonical Adaptation Networks

#639

summarized by : Akihiro Matsufuji

Stephen James, Paul Wohlhart, Mrinal Kalakrishnan, Dmitry Kalashnikov, Alex Irpan, Julian Ibarz, Sergey Levine, Raia Hadsell, Konstantinos Bousmalis

強化学習によるロボットアームのObject Graspingに関する研究

強化学習中に行われるドメインランダマイゼーションの弱点を克服に着目して精度の向上を実現．従来の弱点：ランダマイズされた入力値への汎化とタスクの学習を同時に行う必要があった．本手法：二つの工程に分離（ランダマイズ画像から画像へと変換＋画像から行動への変換）

追加学習なしで70%, 追加学習ありだと94%という高精度を達成した．

工程の分離という新規アイデア＋それぞれの工程の実現において最新の従来手法を取り入れているため，隙がない．結果としても従来手法に比べ精度が良いため．

このページで利用されている画像は論文から引用しています．