Necati Cihan Camgöz, Oscar Koller, Simon Hadfield, Richard Bowden
手話の翻訳を、トランスフォーマーベースのアーキテクチャであるSignLanguage Transformersを使用することで、手話翻訳の精度を高める。
手話翻訳にトランスフォーマーベースのアーキテクチャを導入。
手話ビデオ音声言語翻訳モデルとグロス音声言語翻訳モデルの両方を凌駕し、場合によっては性能が2倍以上2倍以上になることもある(9.58対21.80 BLEU-4スコア)。