#115
summarized by : Yue Qiu
Learning Predictive Models from Observation and Interaction

どんな論文か?

ロボット系でInteractionから学習するには良い学習データを得られるのが困難などの問題点がある.Demoから学習すると①ロボットactionsのアノテーション情報がない;②Humanとロボット間のembodiment差があるなどの問題点がある.この2点を対応した手法を提案.(考え方:InteractionデータでのActionをObservedとし,DemoをUnobservedにする.)
placeholder

新規性

Demoビデオ(actionがアノテーションされていない)とInteraction action(アノテーションされている)から、Actionの予測モデルを学習するフレームワークを提案.具体的、Latent variableモデルを構築し,Demoビデオデータをunobserved , interactionをobserved variablesとし,DNN構造で学習可能なモデルを構築した.

結果

DrivingとObject manipulationの2つの問題設定で,提案手法が有効的にActionを学習し,Action-conditioned 予測精度を向上した;Demoビデオを使わないモデルと比較して、提案手法が有効的にTool-useなどのタスクで大幅に成功率を向上した.

その他(なぜ通ったか?等)

Robotics向けの研究だが,CVの手法をうまく取り込んで切る.Interactionで学習とDemo video学習を統一したフレームワークで処理されているところが新しくて実用性が高い.