南昌交通學(xué)院徐亦丹獲國(guó)家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)獲悉南昌交通學(xué)院申請(qǐng)的專利一種基于深度學(xué)習(xí)的人機(jī)交互語(yǔ)音識(shí)別系統(tǒng)及方法獲國(guó)家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國(guó)家知識(shí)產(chǎn)權(quán)局授予,授權(quán)公告號(hào)為:CN120279921B 。
龍圖騰網(wǎng)通過(guò)國(guó)家知識(shí)產(chǎn)權(quán)局官網(wǎng)在2025-08-26發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請(qǐng)?zhí)?專利號(hào)為:202510740753.4,技術(shù)領(lǐng)域涉及:G10L17/22;該發(fā)明授權(quán)一種基于深度學(xué)習(xí)的人機(jī)交互語(yǔ)音識(shí)別系統(tǒng)及方法是由徐亦丹;龔文輝設(shè)計(jì)研發(fā)完成,并于2025-06-05向國(guó)家知識(shí)產(chǎn)權(quán)局提交的專利申請(qǐng)。
本一種基于深度學(xué)習(xí)的人機(jī)交互語(yǔ)音識(shí)別系統(tǒng)及方法在說(shuō)明書摘要公布了:本發(fā)明公開(kāi)了一種基于深度學(xué)習(xí)的人機(jī)交互語(yǔ)音識(shí)別系統(tǒng)及方法,涉及人機(jī)交互語(yǔ)音識(shí)別技術(shù)領(lǐng)域,本發(fā)明通過(guò)多模態(tài)信號(hào)協(xié)同與動(dòng)態(tài)決策機(jī)制,顯著提升工業(yè)多人協(xié)同場(chǎng)景下的指令識(shí)別魯棒性,采用元學(xué)習(xí)適配層以極低樣本量實(shí)現(xiàn)設(shè)備專屬聲紋映射,突破傳統(tǒng)聲紋模型依賴大規(guī)模數(shù)據(jù)的限制;設(shè)置動(dòng)態(tài)閾值結(jié)合噪聲頻譜分析與設(shè)備狀態(tài),抑制突發(fā)干擾導(dǎo)致的誤判;采用的有限指令語(yǔ)法樹(shù)與傳感器驅(qū)動(dòng)的優(yōu)先級(jí)調(diào)整,使得緊急指令優(yōu)先執(zhí)行,降低安全風(fēng)險(xiǎn)。
本發(fā)明授權(quán)一種基于深度學(xué)習(xí)的人機(jī)交互語(yǔ)音識(shí)別系統(tǒng)及方法在權(quán)利要求書中公布了:1.一種基于深度學(xué)習(xí)的人機(jī)交互語(yǔ)音識(shí)別系統(tǒng),其特征在于,包括, 多模態(tài)采集模塊,用于實(shí)時(shí)獲取語(yǔ)音信號(hào)及關(guān)聯(lián)的紅外人體檢測(cè)信號(hào); 聲紋處理模塊,基于預(yù)訓(xùn)練的通用聲紋識(shí)別模型和可動(dòng)態(tài)加載的設(shè)備專屬適配層,生成說(shuō)話人身份向量; 動(dòng)態(tài)決策模塊,根據(jù)所述語(yǔ)音信號(hào)的實(shí)時(shí)聲紋置信度、紅外人體檢測(cè)信號(hào)的空間一致性,以及預(yù)定義的設(shè)備操作權(quán)限列表,生成指令歸屬判定結(jié)果; 執(zhí)行模塊,響應(yīng)所述判定結(jié)果并輸出控制指令至目標(biāo)設(shè)備; 所述聲紋處理模塊包括: 預(yù)訓(xùn)練聲紋編碼器,用于從語(yǔ)音信號(hào)中提取通用聲紋特征; 所述設(shè)備專屬適配層,通過(guò)元學(xué)習(xí)框架生成,用于將通用聲紋特征映射至設(shè)備操作者特征空間; 所述紅外人體檢測(cè)信號(hào)的空間一致性,指聲源定位坐標(biāo)與紅外人體位置坐標(biāo)的偏差匹配度; 所述元學(xué)習(xí)框架采用模型無(wú)關(guān)元學(xué)習(xí)MAML算法,通過(guò)設(shè)備歷史注冊(cè)語(yǔ)音生成適配參數(shù); 所述設(shè)備專屬適配層中,在新設(shè)備操作者注冊(cè)階段,從至多5條注冊(cè)語(yǔ)音中提取通用聲紋特征,構(gòu)成支持集,并以此初始化元學(xué)習(xí)框架參數(shù),后續(xù)通過(guò)一次帶動(dòng)量的梯度更新生成設(shè)備專屬適配參數(shù),具體流程包括: 構(gòu)建支持集: , 其中,S表示支持集,表示第條注冊(cè)語(yǔ)音提取的通用聲紋特征向量,表示第條注冊(cè)語(yǔ)音對(duì)應(yīng)的身份標(biāo)簽,表示樣本索引,表示支持集樣本總數(shù); 定義支持集平均分類損失為: , 其中,表示支持集上的平均分類損失,表示元模型初始化參數(shù),表示分類損失函數(shù),表示以為參數(shù)的聲紋適配映射函數(shù),表示第條語(yǔ)音的通用聲紋特征向量,表示第條語(yǔ)音對(duì)應(yīng)的身份標(biāo)簽; 定義交叉熵?fù)p失為: , 其中,表示模型預(yù)測(cè)概率向量,表示標(biāo)簽獨(dú)熱編碼向量,表示類別索引,表示類別總數(shù),表示第維標(biāo)簽值,表示第維預(yù)測(cè)概率; 一階梯度更新生成適配參數(shù): , 其中,表示更新后的設(shè)備專屬適配層參數(shù),表示學(xué)習(xí)率,表示對(duì)求梯度; 引入動(dòng)量系數(shù)進(jìn)行二次更新,更新公式為: , 其中,表示動(dòng)量梯度累積,表示動(dòng)量系數(shù),表示學(xué)習(xí)率。
如需購(gòu)買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請(qǐng)人或?qū)@麢?quán)人南昌交通學(xué)院,其通訊地址為:330032 江西省南昌市經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)廣蘭大道899號(hào);或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開(kāi)、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 青島大牧人機(jī)械股份有限公司滿寧寧獲國(guó)家專利權(quán)
- 英特爾公司S.納塔拉詹獲國(guó)家專利權(quán)
- 董烈群獲國(guó)家專利權(quán)
- 顧澤蒼獲國(guó)家專利權(quán)
- 弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)阿德里安·姆塔薩獲國(guó)家專利權(quán)
- 中惠創(chuàng)智無(wú)線供電技術(shù)有限公司馬曉濤獲國(guó)家專利權(quán)
- 西安艾潤(rùn)物聯(lián)網(wǎng)技術(shù)服務(wù)有限責(zé)任公司王林祥獲國(guó)家專利權(quán)
- 杭州巨星科技股份有限公司李躍明獲國(guó)家專利權(quán)
- 北京小米移動(dòng)軟件有限公司趙群獲國(guó)家專利權(quán)
- 深圳幀觀德芯科技有限公司劉雨潤(rùn)獲國(guó)家專利權(quán)


熱門推薦
- 立積電子股份有限公司林昭毅獲國(guó)家專利權(quán)
- 費(fèi)希爾控制產(chǎn)品國(guó)際有限公司L·D·米勒獲國(guó)家專利權(quán)
- 三星電子株式會(huì)社金煐勛獲國(guó)家專利權(quán)
- 陳立獲國(guó)家專利權(quán)
- 上海宇晝科技有限公司陳加成獲國(guó)家專利權(quán)
- 廈門金瑞鎰工貿(mào)有限公司林欲曉獲國(guó)家專利權(quán)
- 長(zhǎng)鑫存儲(chǔ)技術(shù)有限公司請(qǐng)求不公布姓名獲國(guó)家專利權(quán)
- 福特全球技術(shù)公司鄧治兵獲國(guó)家專利權(quán)
- 華為技術(shù)有限公司范強(qiáng)獲國(guó)家專利權(quán)
- 高通股份有限公司A·馬諾拉科斯獲國(guó)家專利權(quán)