summarized by : m3yrin
A Multi-Type Multi-Span Network for Reading Comprehension that Requires Discrete Reasoning

概要

より現実的な文章理解・質問応答タスクにおいては、回答の形式が数値や日時と様々であったり、文章中から複数のテキスト文字列を抽出や、足し算引き算、要素のソートやカウントが必要であるなどの、困難さが存在するため、従来の文章理解(MRC)モデルではパフォーマンスが大幅に低下してしまう。 この研究では、複数の区間(Multi-Span)を抽出できるモデルMTMSNを提案する。 DROPデータセットにて実験を行い、Multi-Spanタイプの回答が求められる質問について、正答率を従来モデルより大幅に改善できることを確認した。
placeholder

新規性

入力文章から複数の重複しない区間を選び出すために、CVの領域で使用される冗長なバウンディングボックスを削除するための手法 Non-maximum suppression (NMS)アルゴリズムを使用する。 事前に必要なSpanの数を予測し、その数だけ重複がないようにSpanの選び出しを行う。 また、NAQANetからの改善として、EncoderをBERTに変更し、算術演算モジュールについてはBeam Searchを用いた補正を行うArithmetic Expression Rerankingという手法を使用している。

結果

DROPデータセットにて実験を行い、Multi-Span形式の回答が求められる質問について、従来のモデルでは一切の回答ができなかった(0.0%@EM)が、 25.1%@EMまでスコアを改善した。