#196
summarized by : QIUYUE
Prompt Distribution Learning

どんな論文か?

大規模事前学習のVision-Language Models(VLMs)で高い性能を得られた一方、最適のテキスト情報がHuman-Craftedの方が多い。また、異なる下流タスクで改めてPromptsを設計する必要な可能性がある。ここで、自動的にVLMsタスクのPromptsを学習可能にした。提案手法では、入力ではなく出力のEmbeddingsからPromptsを学習する。
placeholder

新規性

Human -craftedなPromptsを使わずに、自動的に学習データからPromptsを学習可能な手法の提案。提案手法により、コストが高いPromptsのHuman -craftを省けた。

結果

12つのVision and Languageデータセットにおいて、提案手法がSOTAな性能を達成。また、1カテゴリ1インスタンスにおいて、Human-crafted Promptsと比べて、平均9.1%の精度向上を得られた。

その他(なぜ通ったか?等)