#141
summarized by : Yukitaka Tsuchiya
Sep-Stereo: Visually Guided Stereophonic Audio Generation by Associating Source Separation

どんな論文か?

ステレオの音声合成と音声分離を同時に行うSep-Stereoを提案.
placeholder

新規性

APNet(Associative Pyramid Network)の提案. シーン全体の異なる視覚活性化に応じて,音源の異なる強度を特徴マップのre-schedulingで関連づける.

結果

FAIR-Pay, YT-MUSIC, MUCISデータセットで評価を行った.音声合成では STFT, Envelope Distanceで評価を行い,音声分離では SDR, SIR, SARで評価を行った.

その他(なぜ通ったか?等)

GitHub: [https://github.com/SheldonTsui/SepStereo_ECCV2020] project page: [https://hangz-nju-cuhk.github.io/projects/Sep-Stereo] Demo: [https://www.youtube.com/watch?v=njn7ctayUcI&feature=emb_logo]