#195
summarized by : Yue Qiu
Embodied Language Grounding With 3D Visual Feature Representations

どんな論文か?

language utterancesとcompositional 3D feature representationを関連させた.このような関連付けにより、言語により3D Sceneの生成やGrounding、言語のInstructionによりSceneの編集などを可能にした.
placeholder

新規性

①実用性が高いことに反して、3次元特徴量とLanguage特徴量のFusion・関連付けの研究が少ない;

結果

①3つのタスク(affordability reasoning, referential expression detection, instruction following)において、2D-CNN手法と比べ優位性を示した.②実環境データセットで検証を行い、提案手法の実環境への汎化性能をある程度示した.

その他(なぜ通ったか?等)

3次元Visual Feature特徴とLanguage特徴の対応・Fusionがロボットアプリなどへの応用性が高い.