- …
- …
#176
summarized by : rindybell
どんな論文か?
ドキュメント類には無数の署名がされるため、手書き署名認識は重要である。
しかし、中国語兼では適切なデータが限られている。また、手書き署名は抽出できる特徴が少ないため、認識が難しい。
本論文では、中国語の署名認識用のデータセット構築について説明する。
また、IDNという署名認識法を提案。提案法は、4つの重み共有ストリームを持ち、署名特有の特徴量を抽出できる。
新規性
1. 中国語署名データの構築
データ構築参加者の749名は、自身の名前を20回書く(本物の署名)。
また、単純な10個の偽造署名と、言語学者による10個の認識困難な署名を持つ。
2. 署名認識法
提案法は、入力として署名画像と、テスト画像を受け取る。
入力画像をそれぞれ白黒背景とし、4つの画像を元に、DNNで推論する。
3つの署名・テスト画像ペアに対し本物か偽造か2値分類する。
結果
中国語、英語、ベンガル語、ヒンディー語の4種のデータで、従来法に比べ高精度。
著者らが構築した中国語のデータにて、正解率で8ポイントほど従来法に勝る。
また、2ポイントほどストリーム数=1に勝る。
その他(なぜ通ったか?等)
2つの問題を克服した点が評価されたと思われる。
1つ目は、データセットの問題。中国語に関する大規模な署名データセットは少ない。
二つ目は、アルゴリズムの改善。人出設計した素性は脆弱であり、ニューラル系の手法では署名に特化したアーキテクチャは少なかった。
- …
- …