杭州星麥云商科技有限公司呂曄獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉杭州星麥云商科技有限公司申請的專利基于多模態特征動態融合的數字人語音口型同步控制系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN120319262B 。
龍圖騰網通過國家知識產權局官網在2025-08-19發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510806848.1,技術領域涉及:G10L21/10;該發明授權基于多模態特征動態融合的數字人語音口型同步控制系統是由呂曄;何瑞設計研發完成,并于2025-06-17向國家知識產權局提交的專利申請。
本基于多模態特征動態融合的數字人語音口型同步控制系統在說明書摘要公布了:本發明涉及語音識別控制技術領域,具體為基于多模態特征動態融合的數字人語音口型同步控制系統,包括獲取用戶的歷史講話數據;對歷史講話數據進行特征識別,得到歷史語音特征和歷史口型特征,構建得到個性化語音檔案;并基于歷史語音特征和歷史口型特征構建得到語音映射模型;接收用戶輸入的數據,得到第一數據;基于第一數據進行特征識別,得到第一數據特征;基于語音映射模型和第一數據特征生成第二數據;構建映射校正模型對第二數據進行校正,輸出第三控制參數。本發明通過第三控制參數實現數字人語音口型的同步控制。
本發明授權基于多模態特征動態融合的數字人語音口型同步控制系統在權利要求書中公布了:1.基于多模態特征動態融合的數字人語音口型同步控制系統,其特征在于,包括: 數據輸入模塊,用于接收用戶輸入的數據,得到第一數據;所述第一數據包括視頻數據; 檔案建設模塊,獲取用戶的歷史講話數據;對歷史講話數據進行特征識別,得到歷史語音特征和歷史口型特征,構建得到個性化語音檔案;并基于歷史語音特征和歷史口型特征構建得到語音映射模型; 校正調整模塊,基于第一數據進行特征識別,得到第一數據特征;基于語音映射模型和第一數據特征生成第二數據;構建映射校正模型對第二數據進行校正,包括區分第二數據的標準模式片段和不標準模式片段,對標準模式片段進行適配,并對不標準模式片段進行校正,輸出第三控制參數; 所述第一數據特征包括語音特征和視頻特征; 所述第二數據的獲取過程包括:將第一數據特征輸入至語音映射模型進行識別,所述語音映射模型基于第一數據特征中的語音特征生成口型特征序列;再對第一數據特征中的視頻特征進行識別,得到第一口型特征;基于口型特征序列和第一口型特征進行擬合,再結合語音特征,生成第二數據; 所述第三控制參數的獲取過程包括: 從第二數據中提取口型動態特征和同步語音特征; 利用映射校正模型,分析口型動態特征與同步語音特征之間的內容異常數據、匹配異常數據和流暢異常數據,區分標準模式片段和不標準模式片段; 對于標準模式片段,基于個性化語音檔案生成增強個性化風格的適配控制參數; 對于不標準模式片段,基于個性化語音檔案生成不標準模式片段口型的校正控制參數; 基于適配控制參數和校正控制參數得到第三控制參數; 數據輸出模塊,基于第二數據和第三控制參數生成融合輸出數據。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人杭州星麥云商科技有限公司,其通訊地址為:310000 浙江省杭州市上城區九堡街道九盛路9號A15幢5樓502室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。