#67
summarized by : 日坂 幸次
SignBERT: Pre-Training of Hand-Model-Aware Representation for Sign Language Recognition

どんな論文か?

手話においてハンドジェスチャーは重要な役割を果たしています。 現在の深層学習ベースの手話認識(SLR)手法は、手話のデータソースが限られているため、解釈性が不十分であったり、オーバーフィッティングが発生する可能性がある。

新規性

本論文では、手話認識のための手の事前処理を組み込んだ、初の自己教師付き事前学習可能なSignBERTを紹介する。SignBERTは、手のポーズを視覚的なトークンとして捉え、これは市販のポーズ抽出器から得られる。 このビジュアルトークンには、ジェスチャーの状態、時間、手のキラリティ情報が埋め込まれます。

結果

一眼レフにおける本手法の有効性を検証するために、4つの公開ベンチマークデータセット、すなわち、NMFs-CSL、SLR500、MSASL、WLASLを用いて広範な実験を行った。 実験の結果,自己教師付き学習とインポートされた手の事前情報の両方が有効であることがわかった. さらに,すべてのベンチマークにおいて,注目すべき最先端の性能を達成することができた.

その他(なぜ通ったか?等)