南京郵電大學高浩獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉南京郵電大學申請的專利基于PSO動態搜索分類網絡的帕金森語音識別方法及裝置獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN115472183B 。
龍圖騰網通過國家知識產權局官網在2025-08-08發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202211023500.8,技術領域涉及:G10L25/66;該發明授權基于PSO動態搜索分類網絡的帕金森語音識別方法及裝置是由高浩;甘燕燕;徐楓;郭怡菁;袁杰設計研發完成,并于2022-08-25向國家知識產權局提交的專利申請。
本基于PSO動態搜索分類網絡的帕金森語音識別方法及裝置在說明書摘要公布了:本發明公開了一種基于PSO動態搜索分類網絡的帕金森語音識別方法及裝置,方法包括:獲取帕金森患者的語音數據,對語音數據進行剪輯,從剪輯好的語音數據中提取語音特征,制備語音特征數據集;初始化動態搜索分類網絡的參數,隨機初始化生成分類網絡粒子群;使用語音特征數據集訓練每代分類網絡粒子群中的分類網絡,得到各個粒子的適應度函數值,根據各個粒子的適應度函數值更新分類網絡粒子群,循環訓練更新分類網絡直至得到最優分類網絡,基于訓練所得的最優分類網絡,對待識別的語音特征數據進行帕金森語音識別。
本發明授權基于PSO動態搜索分類網絡的帕金森語音識別方法及裝置在權利要求書中公布了:1.一種帕金森語音識別方法,其特征在于,包括: 步驟1、獲取帕金森患者的語音數據,包括: 所述帕金森患者的語音數據,包括倫敦國王學院MDVR-KCL早期和晚期帕金森患者語音數據集、健康對照者的語音數據集和意大利帕金森語音數據集;其中所述MDVR-KCL早期和晚期帕金森患者語音數據集、健康對照者的語音數據集語言為英語,內容為兩段文本的朗讀語音;其中所述意大利帕金森語音數據集內容為單音節發音數據,包括‘a’‘i’‘e’‘o’‘u’‘ta’‘pa’音節的重復發音; 步驟2、對獲取的語音數據進行剪輯處理,得到剪輯后的語音數據; 步驟3、對剪輯后的語音數據提取語音特征,得到語音特征數據集,包括: 所述語音特征數據集中包括26個語音基本特征、梅爾倒譜系數特征和13個全局特征: 使用Praat聲學分析軟件從每個語音信號中提取一組26個語音基本特征; 基于短時傅里葉變換,使用梅爾濾波器組提取語音信號的梅爾倒譜系數特征; 對于語音信號,提取包括平均值、中位數、均方根、平方、最大值、最小值、第一和第三個四分位數、四分位數范圍、標準差、偏度和峰度13個全局特征; 步驟4、通過預設的動態搜索分類網絡的參數,隨機初始化生成分類網絡粒子群,包括:初始化種群大小為20,迭代次數為10,分類網絡層數范圍為[3,10],對于分類網絡要求第一層必須是卷積層,最后一層必須是完全連接層,隨機初始化分類網絡粒子群中每個分類網絡的結構,分類網絡粒子群訓練時,主循環次數為10; 步驟5、利用語音特征數據集對分類網絡粒子群進行迭代訓練、更新,得到訓練更新好的動態搜索分類網絡模型,包括:使用所述語音特征數據集分別訓練分類網絡粒子群中的各個分類網絡,計算損失函數,并利用損失函數對分類網絡粒子群進行評估得到各個粒子的適應度函數值,根據各個粒子的適應度函數值與全局最佳分類網絡和當前粒子最佳分類網絡的適應度函數值比較的結果,更新全局最佳分類網絡和當前粒子最佳分類網絡,根據全局最佳分類網絡和當前粒子最佳分類網絡更新分類網絡粒子群; 步驟6、將待識別的語音特征數據輸入訓練更新好的動態搜索分類網絡模型,根據所述動態搜索分類網絡模型的輸出,確定帕金森語音識別結果。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人南京郵電大學,其通訊地址為:210012 江蘇省南京市棲霞區文苑路9號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。