Contextual Debiasing for Visual Recognition With Causal Mechanisms

#74

summarized by : QIUYUE

Ruyang Liu; Hao Liu; Ge Li; Haodi Hou; TingHao Yu; Tao Yang

どんな論文か？

実画像は複数の物体が同時に同じシーンに存在するため、物体認識の精度は各々の物体のみではなく、周りの物体の存在で影響されるバイアスが発生する。ここで、因果推論のモデルを導入することで、マルチラベル認識タスクのバイアスを緩和した。物体の特徴、物体の分布状況、推論結果の関係性を認識する因果推論モデルを提案。また、Counterfactualを利用し認識モデルの物体分布の影響を消したモデルを提案。

新規性

Causal InductionモデルをImage Recognitionタスクに導入した。また、Counterfactual Reasoningを利用し、認識に影響を及ぼすバイアスな因果関係の効果を消した。

結果

提案のモデルを導入することで、既存手法（CNN、Transformerベースの手法両方とも）の性能を改良した。また、MSCOCO、PASCAL-VOCなどのデータセットのマルチラベル認識においてSOTAを実現。

その他（なぜ通ったか？等）

Causal InductionモデルをDeep Learningに導入する研究今ちょこちょこある。Debiasが研究課題ではあるが、論文が通しにくいImage Recognition を研究していて、しかも提案手法がとてもシンプルでなかなか強かった。大規模な認識データセットでは因果推理モデルを導入して性能を向上できそうなところまだまだありそう。Total Direct Effectを勉強したい。

このページで利用されている画像は論文から引用しています．