#285
summarized by : Masuyama Yoshiki
Knowledge As Priors: Cross-Modal Knowledge Generalization for Datasets Without Superior Knowledge

どんな論文か?

RGB画像と点群など複数のモダリティのデータがある場合,片方のモダリティの学習済みモデルを教師としてもう片方のモダリティの生徒モデルの学習の補助に使うcross-modal知識蒸留がある.本研究では,この枠組みとメタラーニングを組み合わせ,ターゲットドメインでは生徒モデル用のモダリティのデータしかないが,ソースドメインでは両方のモダリティのデータがある場合を想定し,生徒モデル学習の正則化法を提案.
placeholder

新規性

Cross-modal知識蒸留とメタラーニングを組み合わせた新たな枠組みを提案.ソースドメインにおいて,知識蒸留に基づく正則化項と学習可能なパラメータを持つ正則化項の効果が近くなるように正則化項のパラメータを学習.

結果

手姿勢推定タスクで,Rendered Hand Pose Dataset(シミュレーションデータ)をソースドメインとして利用し,Stereo Hand Pose Tracking Benchmark(実データ)へ"知識を一般化".実データのデータセットでSOTAを達成.また単純な様々なパラメータのweight decayよりも,学習された正則化が有効であることを確認.

その他(なぜ通ったか?等)

Cross-modal知識蒸留を生徒モデルのパラメータに対するpriorとしてうまく解釈し,メタラーニングと組み合わせた.アイデアは新しいが,メタラーニングの文脈での比較があまりなされていない.