浙江工業大學錢麗萍獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網獲悉浙江工業大學申請的專利一種基于CCSK和深度學習的語義通信方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN114595698B 。
龍圖騰網通過國家知識產權局官網在2025-08-15發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202210260485.2,技術領域涉及:G06F40/30;該發明授權一種基于CCSK和深度學習的語義通信方法是由錢麗萍;葉萍;錢江;吳灣灣設計研發完成,并于2022-03-16向國家知識產權局提交的專利申請。
本一種基于CCSK和深度學習的語義通信方法在說明書摘要公布了:為了克服大數據對傳統通信系統帶來的挑戰,本發明提出了一種基于CCSK和深度學習的語義通信方法,實現了語音信號的語義傳輸;發送端將原始語音轉換為文本,對文本進行特征矩陣提取,得到特征矩陣;對征矩陣進行解碼,得到語義信息;對語義信息進行分組擴頻,得到擴頻后的信號并傳輸至接收端;接收端獲取發送端傳輸的擴頻后的信號并進行解擴,得到語義信息,并將語義信息轉成語音,完成傳輸。本發明在數據傳輸方面依靠軟件形式生成擴頻碼,對語義信息進行分組組幀擴頻,能夠節省硬件成本,提高通信的抗干擾性。
本發明授權一種基于CCSK和深度學習的語義通信方法在權利要求書中公布了:1.一種基于CCSK和深度學習的語義通信方法,其特征在于,包括以下步驟: 步驟1:發送端將語音轉換為文本; 步驟2:對步驟1轉換的文本進行特征矩陣提取,得到特征矩陣; 所述步驟2包括以下子步驟: 2.1對步驟1轉換的文本做預處理,所述預處理包括分詞、生成詞向量和詞向量位置編碼三部分;所述預處理具體為:1分詞:對文本進行分詞處理,即將文本輸入jieba中文分詞模型,按文本原順序得到w1,w2,…,wi,…,wn總計n個詞語,下標i表示第i個詞語,i∈[1,n];所述jieba中文分詞模型為一個常用的分詞器模型,可以將句子分成多個詞語;2生成詞向量:隨后將詞語w1,w2,…,wi,…,wn輸入到Word2vec中文預訓練模型,得到相對應的詞向量x1,x2,…,xi,…,xn,所述詞向量x1,x2,…,xi,…,xn為維度為300的行向量;所述Word2vec中文預訓練模型是一種常用的生成詞向量的模型,可以將詞語映射為向量;3詞向量位置編碼:使用正弦余弦函數將詞向量x1,x2,…,xi,…,xn生成位置向量t1,t2,…,ti,…,tn,公式如下: 其中a指的是詞向量xi的第a維度,a∈[1,300];ti,a指的是位置向量ti第a個緯度的值;將詞向量x1,x2,…,xi,…,xn和對應的位置向量t1,t2,…,ti,…,tn相加得到詞嵌入向量e1,e2,…,ei,…,en,其中ei=xi+ti,將詞嵌入向量e1,e2,…,ei,…,en記作矩陣E; 2.2對步驟2.1得到的矩陣E進行自注意力機制操作,所述自注意力機制操作過程如下: 首先生成Query查詢矩陣Q1、Key鍵矩陣K1和Value值矩陣V1: 其中,分別是維數為300的權重方陣,方陣中元素的具體值經過預訓練得到,預訓練共確定十八個權重方陣,所述十八個權重方陣都為維數為300的權重方陣,預訓練使用的數據集在正文開頭加上了單詞“start”,在對應摘要的結尾加上了單詞“eos”,經過預訓練之后,權重方陣會包含“start”和“eos”的特征信息;qi,ki,vi為維度為300的行向量,其中qi為矩陣E中第i個行向量的查詢向量,ki為矩陣E中第i個行向量的鍵向量,vi為矩陣E中第i個行向量的值向量; 令Query查詢矩陣Q1中的查詢向量分別與矩陣K1中的所有鍵向量進行score運算; 以Query查詢矩陣Q1中的查詢向量q1為例,查詢向量q1與鍵向量kii∈[1,n]做score運算,結果記作α1,m,m=i;所述score運算的公式為: 將所有結果α1,1,α1,2,…,α1,m,…,α1,n進行soft-max歸一化操作得到所述soft-max是深度學習中常用的函數,可以把輸入映射成0~1之間的實數,并且保證所有輸入映射到的實數的和為1,soft-max歸一化操作的公式為: 再將分別與Value值矩陣V1中的對應的值向量v1,v2,…vi,…,vn相乘得到加權向量z1,z2,…zm,…,zn,相乘操作為將加權向量z1,z2,…zm,…,zn相加得到思想向量b1; 將上述操作進行n次,得到向量b1,b2,…,bi,…,bn,公式如下: 至此,生成了矩陣E中所有行向量對應的思想向量b1,b2,…,bi,…,bn; 2.3將步驟2.2得到的思想向量b1,b2,…,bi,…,bn通過前饋神經網絡輸出向量f1,f2,…,fi,…,fn,所述前饋神經網絡由兩次變換構成,第一次通過ReLU激活函數做非線性映射,第二次使用線性激活函數恢復到原始梯度; 2.4將步驟2.3得到的向量f1,f2,…,fi,…,fn記作矩陣F,對矩陣F進行自注意力機制操作,本次自注意力機制操作中,將矩陣F分別與權重方陣相乘來生成Query查詢矩陣、Key鍵矩陣和Value值矩陣,其余具體操作過程同步驟2.2,得到矩陣F中所有行向量對應的思想向量d1,d2,…,di,…,dn,并將思想向量d1,d2,…,di,…,dn通過前饋神經網絡輸出向量 將向量記作特征矩陣 步驟3:對步驟2得到的特征矩陣進行解碼,得到語義信息; 步驟4:對步驟3得到的語義信息生成256bit的擴頻碼,通過該擴頻碼對語義信息進行分組擴頻,得到擴頻后的信號并傳輸至接收端; 步驟5:接收端生成與發送端一致的256bit擴頻碼,通過識別同步位來獲取發送端傳輸的擴頻后的信號并進行解擴,得到語義信息; 步驟6:將步驟5得到的語義信息轉成語音,完成傳輸。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人浙江工業大學,其通訊地址為:310014 浙江省杭州市下城區潮王路18號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。