北京三快在線科技有限公司邢原博獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉北京三快在線科技有限公司申請(qǐng)的專利一種語音活動(dòng)檢測(cè)方法、存儲(chǔ)介質(zhì)及電子設(shè)備獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN115171735B 。
龍圖騰網(wǎng)通過國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-22發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202210771781.9,技術(shù)領(lǐng)域涉及:G10L25/78;該發(fā)明授權(quán)一種語音活動(dòng)檢測(cè)方法、存儲(chǔ)介質(zhì)及電子設(shè)備是由邢原博;張宇飛;黃辰設(shè)計(jì)研發(fā)完成,并于2022-06-30向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種語音活動(dòng)檢測(cè)方法、存儲(chǔ)介質(zhì)及電子設(shè)備在說明書摘要公布了:本說明書公開了一種語音活動(dòng)檢測(cè)方法、存儲(chǔ)介質(zhì)及電子設(shè)備,本說明書實(shí)施例將待識(shí)別音頻的音頻特征輸入語音活動(dòng)檢測(cè)模型,得到語音活動(dòng)檢測(cè)模型輸出的識(shí)別結(jié)果,再根據(jù)待識(shí)別音頻對(duì)應(yīng)的識(shí)別場(chǎng)景類型,確定分類參數(shù),最后根據(jù)語音活動(dòng)檢測(cè)模型輸出的識(shí)別結(jié)果以及分類參數(shù),對(duì)待識(shí)別音頻進(jìn)行最終的識(shí)別,從而只需部署一個(gè)通用的語音活動(dòng)檢測(cè)模型即可,而不需要針對(duì)不同的識(shí)別場(chǎng)景分別部署相應(yīng)的語音活動(dòng)檢測(cè)模型,可有效降低模型部署和迭代升級(jí)的成本。
本發(fā)明授權(quán)一種語音活動(dòng)檢測(cè)方法、存儲(chǔ)介質(zhì)及電子設(shè)備在權(quán)利要求書中公布了:1.一種語音活動(dòng)檢測(cè)方法,其特征在于,包括: 獲取待識(shí)別音頻; 從所述待識(shí)別音頻的各音頻幀中提取音頻特征; 將各音頻幀的音頻特征輸入預(yù)先訓(xùn)練的語音活動(dòng)檢測(cè)模型,得到所述語音活動(dòng)檢測(cè)模型輸出的各音頻幀為語音段的概率; 根據(jù)所述待識(shí)別音頻對(duì)應(yīng)的識(shí)別場(chǎng)景類型,確定分類參數(shù); 根據(jù)所述語音活動(dòng)檢測(cè)模型輸出的各音頻幀為語音段的概率以及所述分類參數(shù),識(shí)別各音頻幀是否為語音段; 所述獲取待識(shí)別音頻,具體包括: 獲取流式輸入的待識(shí)別音頻;或者,獲取非流式輸入的待識(shí)別音頻; 所述將各音頻幀的音頻特征輸入預(yù)先訓(xùn)練的語音活動(dòng)檢測(cè)模型,具體包括: 當(dāng)所述待識(shí)別音頻為流式輸入的音頻時(shí),將所述待識(shí)別音頻中的各音頻幀的音頻特征以流式輸入的方式輸入預(yù)先訓(xùn)練的語音活動(dòng)檢測(cè)模型; 當(dāng)所述待識(shí)別音頻為非流式輸入的音頻時(shí),將所述待識(shí)別音頻中的各音頻幀的音頻特征以非流式輸入的方式輸入預(yù)先訓(xùn)練的語音活動(dòng)檢測(cè)模型; 所述獲取待識(shí)別音頻,還具體包括: 接收識(shí)別請(qǐng)求,并獲取所述識(shí)別請(qǐng)求對(duì)應(yīng)的待識(shí)別音頻; 所述根據(jù)所述待識(shí)別音頻對(duì)應(yīng)的識(shí)別場(chǎng)景類型,確定分類參數(shù),具體包括: 根據(jù)所述識(shí)別請(qǐng)求,確定所述待識(shí)別音頻對(duì)應(yīng)的識(shí)別場(chǎng)景類型; 根據(jù)所述待識(shí)別音頻對(duì)應(yīng)的識(shí)別場(chǎng)景類型,確定所述識(shí)別場(chǎng)景類型對(duì)應(yīng)的概率閾值、平滑處理參數(shù); 所述根據(jù)所述語音活動(dòng)檢測(cè)模型輸出的各音頻幀為語音段的概率以及所述分類參數(shù),識(shí)別各音頻幀是否為語音段,具體包括: 針對(duì)每個(gè)音頻幀,根據(jù)所述語音活動(dòng)檢測(cè)模型輸出的該音頻幀為語音段的概率以及預(yù)先確定的概率閾值,識(shí)別該音頻幀是否為語音段; 根據(jù)所述平滑處理參數(shù)以及所述待識(shí)別音頻中各音頻幀的識(shí)別結(jié)果,對(duì)各音頻幀的識(shí)別結(jié)果進(jìn)行平滑處理。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人北京三快在線科技有限公司,其通訊地址為:100080 北京市海淀區(qū)北四環(huán)西路9號(hào)2106-030;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 深圳麥格米特電氣股份有限公司周滿枝獲國(guó)家專利權(quán)
- 洋馬動(dòng)力科技有限公司平松敏史獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司季秉武獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司李勝鈺獲國(guó)家專利權(quán)
- 谷歌有限責(zé)任公司大衛(wèi)·林德獲國(guó)家專利權(quán)
- 高通股份有限公司吳潔獲國(guó)家專利權(quán)
- 北京奇藝世紀(jì)科技有限公司章敏杰獲國(guó)家專利權(quán)
- 文塔納醫(yī)療系統(tǒng)公司M.巴恩斯獲國(guó)家專利權(quán)
- 威斯康星州醫(yī)藥大學(xué)股份有限公司X·A·李獲國(guó)家專利權(quán)
- 杭州諾茂醫(yī)療科技有限公司王永勝獲國(guó)家專利權(quán)


熱門推薦
- 晶元光電股份有限公司林羿宏獲國(guó)家專利權(quán)
- 伊瑪提克斯生物技術(shù)有限公司安德烈·馬爾獲國(guó)家專利權(quán)
- 江蘇宇通干燥工程有限公司陸文光獲國(guó)家專利權(quán)
- 德克斯康公司R·E·斯庫(kù)恩馬克獲國(guó)家專利權(quán)
- 萬喻獲國(guó)家專利權(quán)
- LG 電子株式會(huì)社姜智源獲國(guó)家專利權(quán)
- 谷歌有限責(zé)任公司雷吉納爾德·克利福德·揚(yáng)獲國(guó)家專利權(quán)
- 英特爾公司H·阿布薩拉赫獲國(guó)家專利權(quán)
- 福特全球技術(shù)公司馬克·席爾瓦·康德拉德獲國(guó)家專利權(quán)
- 谷歌有限責(zé)任公司凱登·邁爾獲國(guó)家專利權(quán)