Face-Focused Cross-Stream Network for Deception Detection in Videos

#794

summarized by : Takahiro Itazuri

Mingyu Ding, An Zhao, Zhiwu Lu, Tao Xiang, Ji-Rong Wen

どんな論文か？

動画から嘘を検出する手法であるFace-Focused Cross-Stream Network (FFCSN)を提案した。嘘検出においては顔の表情と体の動きが重要であるが、両者は非同期的に発生することが多く、既存のtwo-steam networkは上手く扱うことができなかったが、提案手法ではこれを克服している。

新規性

spatial streamとtemporal streamを統合するためにcorrelation learningを行い、顔の表情と体の動きが非同期に発生する場合においても嘘を検出できるようになった。また嘘のデータは少ないためメタラーニングを用いて、過学習せず汎化性能を高めるように学習した。

結果

Ablation Studyを行った結果、提案した手法がもっとも高い精度を出した。また既存手法より高い精度を出した。

その他（なぜ通ったか？等）

精度が出ている点が大きいと思われるが、spatial streamとtemporal streamを統合する手法自体は汎用的に利用できるため、他タスクへの応用の可能性が考えられる。

このページで利用されている画像は論文から引用しています．