#110
summarized by : Haruhi Shida
Rethinking Closed-Loop Training for Autonomous Driving

どんな論文か?

本研究では,自動運転のための効果的なクローズループベンチマークを作成するために、交通シナリオの設計方法と訓練環境の規模について検討した.結果は,長期的な推論と計画を行うことができる新しい運転方針学習手法の開発に成功,既存の手法が抱える問題の解決方法を提案する.提案手法を理論的に分析し,新しいベンチマークにおいてベースラインに対する提案手法の優位性を実証した.
placeholder

新規性

シュミレータの進歩により,自動運転エージェンのクローズループトレーニングが可能となったが,効果的なベンチマークの構築は十分に検討されていなかった.本研究は,交通シナリオの設計や,訓練環境の拡張方法など,異なる訓練ベンチマーク設計が学習エージェントの成功に及ぼす影響を分析して実証した.効果的なベンチマーク構築を十分に検討した初めての研究である.

結果

実証実験の結果,多くの一般的なRLに基づいた学習アルゴリズムは「long planingを持つことが出来ない」「訓練に非常に長い時間を要する」などの理由から自動運転において,満足な性能を達成できないことを示す.この問題を踏まえ開発した,多段階先読みによるプランニングを実現するTRAVLはより従来のベースラインにくらべて高速に学習が可能で,安全な操縦を実現することができることを実証した.

その他(なぜ通ったか?等)

【なぜ通ったか?】 学習データ生成の様々な設計上の選択が,クローズループトレーニングでの学習の成功にどのような影響を与えるかについて,十分に検討した初めての研究だったため.また実験結果に基づいて開発した,提案手法TRAVLが既存の手法が抱える問題を解決できる性能を持っていることも,本研究での検討が適切であったことを示している. 【添付画像について】 提案手法TRAVLとベースラインの比較