北京百度網訊科技有限公司趙情恩獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉北京百度網訊科技有限公司申請的專利模型訓練方法、聲紋特征的提取方法及其設備、程序產品獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114005453B 。
龍圖騰網通過國家知識產權局官網在2025-08-22發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202111290709.6,技術領域涉及:G10L17/02;該發明授權模型訓練方法、聲紋特征的提取方法及其設備、程序產品是由趙情恩設計研發完成,并于2021-11-02向國家知識產權局提交的專利申請。
本模型訓練方法、聲紋特征的提取方法及其設備、程序產品在說明書摘要公布了:本公開提供的模型訓練方法、聲紋特征的提取方法及其設備、程序產品中,涉及一種模型訓練方法、聲紋特征的提取方法及其設備、程序產品。技術方案包括:獲取應用在第一場景的第一模型、第一子幀以及目標子幀其中,第一音頻具有標注信息;提取第一子幀的第一頻譜特征,并提取目標子幀的目標頻譜特征;根據第一子幀的第一頻譜特征、第一音頻的標注信息、目標子幀的目標頻譜特征以及目標子幀所屬的目標音頻,對第一模型進行訓練,得到目標模型。這種實施方式中將子幀所屬的目標音頻的信息作為子幀的標注信息,從而能夠利用具有標注信息的第一音頻和目標音頻對第一模型進行訓練,得到可以識別目標場景中音頻的聲紋特征的目標模型。
本發明授權模型訓練方法、聲紋特征的提取方法及其設備、程序產品在權利要求書中公布了:1.一種模型訓練方法,包括: 獲取應用在第一場景的第一模型、第一子幀以及多個目標子幀,所述第一子幀是對應用在第一場景的第一音頻進行分幀處理得到的,所述多個目標子幀是對應用在目標場景的目標音頻進行分幀處理得到的;其中,所述第一音頻具有標注信息;所述多個目標子幀中包括屬于同一個目標音頻的子幀,以及不屬于同一個目標音頻的子幀; 提取所述第一子幀的第一頻譜特征,并提取所述目標子幀的目標頻譜特征; 重復執行下述步驟,直到滿足預設的停止訓練條件: 將所述第一頻譜特征以及所述目標頻譜特征輸入所述第一模型,得到與所述第一頻譜特征對應的識別結果,以及與所述目標子幀對應的目標特征向量; 利用所述第一頻譜特征的識別結果以及所述第一音頻的標注信息、所述目標子幀的目標特征向量以及所述目標子幀所屬的目標音頻確定損失函數的值,并利用所述損失函數的值調整所述第一模型中的參數以優化所述第一模型,得到優化后的第一模型; 其中,滿足所述預設的停止訓練條件時得到的優化后的第一模型為目標模型;所述目標模型用于獲取用戶的聲紋特征。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京百度網訊科技有限公司,其通訊地址為:100085 北京市海淀區上地十街10號百度大廈2層;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。