#391
summarized by : Yue Qiu
Weakly Supervised Visual Semantic Parsing

どんな論文か?

Scene Graph GenerationのためのWeakly supervised手法を提案(BBOX annotationがいらない).提案手法はまずEntityとpredicateを分けて認識を行い,DynamicでAttention-basedなIterativeなフレームワークによりノード及びノード間の関係を段階で予測する.また,Graph alignmentアルゴリズムを提案した.
placeholder

新規性

①提案手法はBBox annotationなしで行える;②ExhaustiveなObject proposal pairs間の関係探索を行わないため,Runtimeが速い;③任意数のEntitiesから,よりFlexibleなGraphsを生成できる.

結果

提案のVSPNetが他のWeakly supervised手法と比べ高い精度を得られた.同時に,従来の手法より数倍速く行える.

その他(なぜ通ったか?等)

Scene GraphのAnnotationコストが高くて,この研究では物体領域ごとにLabel情報がなくても行えるVisual Semantic Parsing手法を提案.