成都愛奇藝智能創(chuàng)新科技有限公司李海獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉成都愛奇藝智能創(chuàng)新科技有限公司申請(qǐng)的專利一種音頻處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN114842858B 。
龍圖騰網(wǎng)通過國家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-22發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202210457487.0,技術(shù)領(lǐng)域涉及:G10L21/013;該發(fā)明授權(quán)一種音頻處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)是由李海;文博龍;閆影;甘文東;陳海濤;郭凱旋;王松;李嘉文設(shè)計(jì)研發(fā)完成,并于2022-04-27向國家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種音頻處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在說明書摘要公布了:本發(fā)明涉及一種音頻處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),其中,音頻處理方法包括:獲取目標(biāo)視頻對(duì)應(yīng)的第一音頻文件,提取所述第一音頻文件中第一配音對(duì)象的配音內(nèi)容對(duì)應(yīng)的配音特征,所述第一音頻文件中的第一語種與所述目標(biāo)視頻的原聲音頻文件中的第二語種不同;獲取第二配音對(duì)象對(duì)應(yīng)的音色特征,所述第一配音對(duì)象和所述第二配音對(duì)象具有不同的音色;將所述配音特征和所述音色特征合并,得到音頻頻譜;基于所述音頻頻譜進(jìn)行音頻重建,得到與所述目標(biāo)視頻對(duì)應(yīng)的第二音頻文件。本申請(qǐng)實(shí)施例能夠?qū)崿F(xiàn)自動(dòng)將第一配音對(duì)象的音色轉(zhuǎn)換第二配音對(duì)象的音色的同時(shí),保留第一配音對(duì)象配音的內(nèi)容及情感。
本發(fā)明授權(quán)一種音頻處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在權(quán)利要求書中公布了:1.一種音頻處理方法,其特征在于,包括: 獲取目標(biāo)視頻對(duì)應(yīng)的第一音頻文件,提取所述第一音頻文件中第一配音對(duì)象的配音內(nèi)容對(duì)應(yīng)的配音特征,所述第一音頻文件中的第一語種與所述目標(biāo)視頻的原聲音頻文件中的第二語種不同; 獲取第二配音對(duì)象對(duì)應(yīng)的音色特征,所述第一配音對(duì)象和所述第二配音對(duì)象具有不同的音色; 將所述配音特征和所述音色特征合并,得到音頻頻譜; 基于所述音頻頻譜進(jìn)行音頻重建,得到與所述目標(biāo)視頻對(duì)應(yīng)的第二音頻文件; 其中,所述獲取目標(biāo)視頻對(duì)應(yīng)的第一音頻文件,包括:獲取目標(biāo)視頻對(duì)應(yīng)的原聲音頻文件、配音音頻文件、第一臺(tái)詞文本及第二臺(tái)詞文本,所述第一臺(tái)詞文本是對(duì)所述配音音頻文件進(jìn)行語音識(shí)別得到的,其中不包含角色信息,所述配音音頻文件是利用與所述目標(biāo)視頻的原聲音頻文件的第二語種不同的第一語種配音得到的,所述第二臺(tái)詞文本與所述原聲音頻文件對(duì)應(yīng),其中包含角色信息;根據(jù)所述目標(biāo)視頻、所述第一臺(tái)詞文本和所述原聲音頻文件確定屬于同一角色的人臉發(fā)言的發(fā)言時(shí)間段及與所述發(fā)言時(shí)間段對(duì)應(yīng)的臺(tái)詞內(nèi)容;根據(jù)所述發(fā)言時(shí)間段、與所述發(fā)言時(shí)間段對(duì)應(yīng)的臺(tái)詞內(nèi)容和所述第二臺(tái)詞文本對(duì)所述配音音頻文件進(jìn)行音頻分軌,得到每個(gè)角色發(fā)言的時(shí)間段及與所述時(shí)間段對(duì)應(yīng)的音頻文件;將任一角色發(fā)言的時(shí)間段所對(duì)應(yīng)的音頻文件確定為所述目標(biāo)視頻對(duì)應(yīng)的第一音頻文件; 所述根據(jù)所述目標(biāo)視頻、所述第一臺(tái)詞文本和所述原聲音頻文件確定屬于同一角色的人臉發(fā)言的發(fā)言時(shí)間段及與所述發(fā)言時(shí)間段對(duì)應(yīng)的臺(tái)詞內(nèi)容,包括:在所述目標(biāo)視頻中提取人臉出現(xiàn)時(shí)間戳;在原聲音頻文件中提取聲紋出現(xiàn)片段時(shí)間戳;在所述第一臺(tái)詞文本中提取第一語種臺(tái)詞片段出現(xiàn)時(shí)間戳;將所述聲紋出現(xiàn)片段時(shí)間戳和所述人臉出現(xiàn)時(shí)間戳進(jìn)行匹配,得到屬于同一角色的人臉發(fā)言的發(fā)言時(shí)間段;將屬于同一角色的人臉發(fā)言的發(fā)言時(shí)間段和第一語種臺(tái)詞片段出現(xiàn)時(shí)間戳進(jìn)行匹配,得到與所述發(fā)言時(shí)間段對(duì)應(yīng)的臺(tái)詞內(nèi)容。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人成都愛奇藝智能創(chuàng)新科技有限公司,其通訊地址為:610096 四川省成都市(四川)自由貿(mào)易試驗(yàn)區(qū)成都高新區(qū)新川南五路188號(hào)7、8樓;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。


熱門推薦
- 舍弗勒技術(shù)股份兩合公司萊因哈特·馬利克獲國家專利權(quán)
- 羅伯特·博世有限公司M.席格獲國家專利權(quán)
- 深圳市中天迅通信技術(shù)股份有限公司鄒毅獲國家專利權(quán)
- 三菱電機(jī)株式會(huì)社埴岡翔太獲國家專利權(quán)
- 大和制衡株式會(huì)社長(zhǎng)井孝幸獲國家專利權(quán)
- 騰訊科技(深圳)有限公司李茂材獲國家專利權(quán)
- 中裕遠(yuǎn)景(北京)環(huán)境科技有限公司柴磊獲國家專利權(quán)
- 福州高意光學(xué)有限公司賈旭獲國家專利權(quán)
- 香港科技大學(xué)穆罕默德·奧斯曼·布塔獲國家專利權(quán)
- 特法公司斯坎德爾·利姆獲國家專利權(quán)