summarized by : H.Yamamoto
Rationalizing Medical Relation Prediction from Corpus-level Statistics

概要

二つのentity同士の関係の予測の手法。人間の記憶の仕組みにヒントを得て処理を3段階に分けることで、人間が理解しやすい形で判断の根拠を示すことができるようにした。 医療用途を主眼としているが、手法自体は汎用的。 headとtailを受け取ってその間の関係を予測するという処理を以下の3段階に分ける。 段階1: 二つのentityそれぞれについて関連するentityの集合を洗い出す 段階2: head側、tail側の各関連entityの組み合わせについて、対応する関係を確率(※1)で加重平均したベクトルを計算し、それをさらに両entityのベクトルと組み合わせたベクトル表現を得る 段階3: そのベクトル表現を、その組み合わせの確率(※2)で加重平均したベクトルを計算し、そこから関係の確率を計算する。 上記の※1と※2の積を取ることで参考にした(head, relation, tail)のtripleをスコア付けすることができる。 この上位Kコを判断根拠として提示する。
placeholder

新規性

従来手法に劣らない予測精度を保ちながら、参考にした(head, relation, tail)の上位Kコという人間が理解しやすい形で判断根拠を提示することができる関係予測の手法となっている。

結果

代表的なentity encoderとrelation scoring functionの組と比較し、いくつかの関係と、全体平均では最も高い予測精度が得られた。 なお、比較対象としてもっと複雑で高性能なモデルを試すこともできるかもしれないが、そういうモデルは基本的に人間が理解しやすい判断根拠を与えない(なので医療現場では採用しにくい場合がある)。 一方、本研究はどちらかというと解釈可能性に重点を置いている。 その解釈可能性については、臨床経験のあるM.D.に各判断根拠についてそれがhelpfulかどうかを4段階(0: no helpful - 3: very helpful)で評価してもらった。 各事例についての根拠top-5中での最高評価値の平均を取ると、2.04となった。