SignBERT: Pre-Training of Hand-Model-Aware Representation for Sign Language Recognition

#67

summarized by : 日坂　幸次

Hezhen Hu, Weichao Zhao, Wengang Zhou, Yuechen Wang, Houqiang Li

どんな論文か？

手話においてハンドジェスチャーは重要な役割を果たしています。現在の深層学習ベースの手話認識（SLR）手法は、手話のデータソースが限られているため、解釈性が不十分であったり、オーバーフィッティングが発生する可能性がある。

新規性

本論文では、手話認識のための手の事前処理を組み込んだ、初の自己教師付き事前学習可能なSignBERTを紹介する。SignBERTは、手のポーズを視覚的なトークンとして捉え、これは市販のポーズ抽出器から得られる。このビジュアルトークンには、ジェスチャーの状態、時間、手のキラリティ情報が埋め込まれます。

結果

一眼レフにおける本手法の有効性を検証するために、4つの公開ベンチマークデータセット、すなわち、NMFs-CSL、SLR500、MSASL、WLASLを用いて広範な実験を行った。実験の結果，自己教師付き学習とインポートされた手の事前情報の両方が有効であることがわかった．さらに，すべてのベンチマークにおいて，注目すべき最先端の性能を達成することができた．

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．