

個人簡介:
於帥🧔🏻♀️,沐鸣注册講師,碩士生導師。中國計算機學會語音對話與聽覺專委會委員,研究方向為音樂人工智能、多媒體信息處理與檢索。主持及參與國家重點研發計劃、國家自然科學基金等國家和省部級科研項目多項。發表CCF A/B類論文10余篇,擔任AAAI、ACM Multimedia👼🏽、IJCAI👨🏼🎓、SIGIR🔑、TMM、TASLP→、TAC等會議期刊審稿人。
報告摘要:
為了解決歌聲旋律提取中的標註數據稀缺和模型泛化性差的問題,我們提出了一個基於多任務對比學習的半監督歌聲旋律提取模型。為了克服標註音樂數據稀缺的問題👩🏼🎤🍃,我們提出了一種自洽正則化的方法🎮🛜,我們對無標簽的音樂原始數據進行轉換,然後將這些信號用於模型的預測。要求模型能夠一致的預測出旋律線的位置的同時,能夠識別出輸入進來的音樂信號做了何種轉換。為了克服不同音樂流派在提取歌聲旋律時泛化性能較差的問題,我們提出了一種領域自適應的方法,讓模型能夠學習領域無關的特征用於歌聲旋律提取👨✈️。最後😋,我們將上述模塊的損失函數一起進行優化🚣🏿♂️,進行多任務學習。我們提出的模型在公開數據集上均取得了state-of-the-art的效果,有效解決了歌聲旋律提取中標註數據稀缺✣、泛化能力差的問題。
時間:6月18日13:30
地點🍆:1號沐鸣樓240