杭州星麥云商科技有限公司呂曄獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州星麥云商科技有限公司申請的專利基于聲紋特征遷移的數字人音色自適應匹配方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120356474B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510779082.2,技術領域涉及:G10L17/02;該發明授權基于聲紋特征遷移的數字人音色自適應匹配方法及系統是由呂曄;何瑞設計研發完成,并于2025-06-12向國家知識產權局提交的專利申請。
本基于聲紋特征遷移的數字人音色自適應匹配方法及系統在說明書摘要公布了:本發明涉及語音合成技術領域,具體為基于聲紋特征遷移的數字人音色自適應匹配方法及系統。該發明首先采用深度聲紋解耦網絡,通過多任務對抗學習策略處理用戶語音樣本,提取與內容及通用聲學特征解耦的純凈音色身份嵌入,并同時提取用于表征音色宏觀特性與微觀細節的多尺度音色特征。然后,根據用戶配置,從多尺度音色特征中選取組合并分配語音合成權重,形成定制化聲紋特征集。最后,將純凈音色身份嵌入及定制化聲紋特征集作為條件注入擴散流匹配神經聲碼器,該聲碼器結合概率流轉換與逐步去噪精煉,依據待合成內容信息,生成具有用戶獨特音色且與內容對應的數字人語音合成波形。本發明旨在實現數字人音色精準、靈活且高度個性化的自適應匹配。
本發明授權基于聲紋特征遷移的數字人音色自適應匹配方法及系統在權利要求書中公布了:1.基于聲紋特征遷移的數字人音色自適應匹配方法,其特征在于,包括以下步驟: 采用深度聲紋解耦網絡處理用戶的語音樣本,所述深度聲紋解耦網絡通過多任務對抗學習策略,從所述語音樣本中提取與內容信息及通用聲學特征信息相解耦的純凈音色身份嵌入,并提取用于表征用戶音色宏觀特性與微觀細節的多尺度音色特征; 根據用戶配置,從所述多尺度音色特征中選取組合并分配語音合成權重,形成定制化聲紋特征集; 將所述純凈音色身份嵌入及定制化聲紋特征集作為條件,注入擴散流匹配神經聲碼器;所述擴散流匹配神經聲碼器在接收待合成內容信息后,通過概率流轉換與逐步去噪精煉,生成具有用戶獨特音色且與內容對應的數字人語音合成波形。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州星麥云商科技有限公司,其通訊地址為:310000 浙江省杭州市上城區九堡街道九盛路9號A15幢5樓502室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。