#25
summarized by : Katsuyuki Nakamura
Scan2Cap: Context-Aware Dense Captioning in RGB-D Scans

どんな論文か?

RGBDデータを入力として、物体のバウンディングボックスと説明文を出力するDense captioningを提案
placeholder

新規性

(タスク新規性)3DシーンにおけるDense captioningタスク、(技術的な新規性)関係グラフを用いて空間配置を考慮した文章生成モジュール

結果

ScanReferデータセット※において、キャプショニング精度が大幅に向上(CiDErで+27.61ポイント) ※同じ研究グループによってECCV2020で提案されたデータセット

その他(なぜ通ったか?等)

https://daveredrum.github.io/Scan2Cap/