平安科技(深圳)有限公司周亞云獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉平安科技(深圳)有限公司申請(qǐng)的專利口音語音識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN112863485B 。
龍圖騰網(wǎng)通過國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-09-02發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202011635764.X,技術(shù)領(lǐng)域涉及:G10L15/00;該發(fā)明授權(quán)口音語音識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)是由周亞云;馬駿;王少軍設(shè)計(jì)研發(fā)完成,并于2020-12-31向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本口音語音識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在說明書摘要公布了:本發(fā)明涉及人工智能領(lǐng)域,公開了一種口音語音識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。該方法包括:獲取多種口音語音樣本,并分別對(duì)各所述口音語音樣本進(jìn)行口音標(biāo)注和音素標(biāo)注,對(duì)應(yīng)得到多種口音標(biāo)簽和音素狀態(tài)序列;分別提取各所述口音語音樣本對(duì)應(yīng)的第一聲學(xué)特征;將所述第一聲學(xué)特征、所述口音標(biāo)簽和所述音素狀態(tài)序列輸入預(yù)置訓(xùn)練模型進(jìn)行訓(xùn)練,得到口音語音識(shí)別模型;獲取待識(shí)別的口音語音,并提取所述口音語音的第二聲學(xué)特征;將所述第二聲學(xué)特征輸入所述口音語音識(shí)別模型進(jìn)行識(shí)別,輸出所述口音語音對(duì)應(yīng)的第二口音類別和音素狀態(tài)序列。本發(fā)明通過引入門機(jī)制和口音識(shí)別分支,實(shí)現(xiàn)了多種口音語音的準(zhǔn)確識(shí)別。
本發(fā)明授權(quán)口音語音識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在權(quán)利要求書中公布了:1.一種口音語音識(shí)別方法,其特征在于,所述口音語音識(shí)別方法包括: 獲取多種口音語音樣本,并分別對(duì)各所述口音語音樣本進(jìn)行口音標(biāo)注和音素標(biāo)注,對(duì)應(yīng)得到多種口音標(biāo)簽和音素狀態(tài)序列; 分別提取各所述口音語音樣本對(duì)應(yīng)的第一聲學(xué)特征; 將所述第一聲學(xué)特征、所述口音標(biāo)簽和所述音素狀態(tài)序列輸入預(yù)置訓(xùn)練模型進(jìn)行訓(xùn)練,得到口音語音識(shí)別模型; 獲取待識(shí)別的口音語音,并提取所述口音語音的第二聲學(xué)特征; 將所述第二聲學(xué)特征輸入所述口音語音識(shí)別模型進(jìn)行識(shí)別,輸出所述口音語音對(duì)應(yīng)的第二口音類別和音素狀態(tài)序列; 所述訓(xùn)練模型包括:Baseline模型和Xvector模型,所述Baseline模型包括第一TDNN網(wǎng)絡(luò)、門機(jī)制層、第二TDNN網(wǎng)絡(luò)和Softmax層,所述將所述第一聲學(xué)特征、所述口音標(biāo)簽和所述音素狀態(tài)序列輸入預(yù)置訓(xùn)練模型進(jìn)行訓(xùn)練,得到口音語音識(shí)別模型包括:將所述第一聲學(xué)特征輸入所述第一TDNN網(wǎng)絡(luò)進(jìn)行聲學(xué)信息提取,得到第一有效信息;將所述第一有效信息輸入所述Xvector模型進(jìn)行口音類別識(shí)別,得到所述口音語音樣本對(duì)應(yīng)的第一口音類別;將所述第一有效信息和所述第一口音類別輸入所述門機(jī)制層進(jìn)行口音信息融合,得到第一口音融合信息;將所述第一口音融合信息輸入所述第二TDNN網(wǎng)絡(luò)進(jìn)行口音信息調(diào)整,得到第一口音調(diào)整信息;將所述第一口音調(diào)整信息輸入所述Baseline模型中的Softmax層進(jìn)行特征運(yùn)算,輸出所述口音語音樣本對(duì)應(yīng)的音素狀態(tài)序列;根據(jù)所述口音標(biāo)簽和所述音素狀態(tài)序列,調(diào)用預(yù)置損失函數(shù),計(jì)算所述口音語音樣本對(duì)應(yīng)的第一口音類別和音素狀態(tài)序列的誤差值;根據(jù)所述誤差值,對(duì)所述Baseline模型和所述Xvector模型進(jìn)行參數(shù)調(diào)優(yōu),直至所述Baseline模型和所述Xvector模型收斂,得到口音語音識(shí)別模型。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人平安科技(深圳)有限公司,其通訊地址為:518033 廣東省深圳市福田區(qū)福田街道福安社區(qū)益田路5033號(hào)平安金融中心23樓;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 凌衛(wèi)東獲國(guó)家專利權(quán)
- 云南省農(nóng)業(yè)科學(xué)院農(nóng)產(chǎn)品加工研究所田浩獲國(guó)家專利權(quán)
- 賽靈思公司B·S·馬丁獲國(guó)家專利權(quán)
- 廈門英仕衛(wèi)浴有限公司陸海濤獲國(guó)家專利權(quán)
- 深圳怡化電腦股份有限公司崔明杰獲國(guó)家專利權(quán)
- 賽峰短艙公司蒂埃里·雅克·艾伯特·勒多克特獲國(guó)家專利權(quán)
- 深圳市中科藍(lán)訊科技股份有限公司陳文韜獲國(guó)家專利權(quán)
- 樂金顯示有限公司卓潤(rùn)星獲國(guó)家專利權(quán)
- 日鐵新材料股份有限公司山田隆獲國(guó)家專利權(quán)
- 南京南瑞繼保電氣有限公司王凱獲國(guó)家專利權(quán)


熱門推薦
- 阿里巴巴集團(tuán)控股有限公司鄭衛(wèi)東獲國(guó)家專利權(quán)
- 東京毅力科創(chuàng)株式會(huì)社中澤貴士獲國(guó)家專利權(quán)
- 索音醫(yī)療公司穆罕默德·霍納爾瓦爾獲國(guó)家專利權(quán)
- 交互數(shù)字VC控股法國(guó)公司J.里卡德獲國(guó)家專利權(quán)
- 三星顯示有限公司金正起獲國(guó)家專利權(quán)
- 深圳市光羿科技有限公司劉倩男獲國(guó)家專利權(quán)
- 瑞典愛立信有限公司烏爾夫·古斯塔夫松獲國(guó)家專利權(quán)
- 阿瑟雷克斯股份有限公司S·巴赫梅爾獲國(guó)家專利權(quán)
- 杭州濱冠節(jié)能科技有限公司余渙清獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司孫志磊獲國(guó)家專利權(quán)