#74
summarized by : Haruhi Shida
Cross-Modality Knowledge Distillation Network for Monocular 3D Object Detection

どんな論文か?

単眼3D検出精度を大幅に改善するCross Modarity Knoledge Distirlation(CMKD)ネットワークを提案.提案手法は,大規模な非ラベル化データから有用な知識を抽出することが可能で,アノテーションコストを削減しながら性能を更に向上させることができる.また,提案手法の半教師付きフレームワークへの拡張で,ラベルのないデータの有効な活用方法と新たな可能性も示した.
placeholder

新規性

本論文では,LidarモダリティからImageモダリティに効率的かつ直接的に特徴と反応の両方で知識を伝達するCross-Modality Knowledge Distillationを提案.これは,既存の3D単眼検出手法の課題である「非End to Endの学習戦略を適用しており,Lidar情報を充分に活用できていない」という問題を解決するものである.

結果

WaymoとKITTI,2つのベンチマークで最先端手法から大幅に制度を改善.有効性を示した.(添付画像はCMKDのKITTI testでの実験結果)

その他(なぜ通ったか?等)

【なぜ通ったのか】 既存の課題を解決するだけでなく,半教師付き学習フレームワークとして拡張,単眼3D検出における新たな可能性も切り開いたため.CMKDフレームワークを用いて,ラベルのないデータを効果的に蒸留しマルチタスク学習に用いることができる,ということも示した. これは自律走行車のためのラベルのないデータを収集しやすい実世界のシナリオで,CMKDの適用を一般化する価値を示すものである.